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Prufungsantrag gem. § 44 PatG ist gestellt 

@ Datenverbindungsverfahren und Vorrichtung fur Multiprozessor-Computersysteme mit gemeinsamem 
Speicher 

,^7) Die vorliegende Erfindung offonbart ein Multiprozessor- 
Computersystem mit gemeinsam verwendetem Speicher, 
bei dem mehrere Prozessoren Kopien eines gemeinsam 
verwendeten Datenblocks in ihren lokalen Cache-Speichern 
zwischenspeichern konnen und unabhangig ihre zwischen- 
gespeicherten Kopien verandern konnen. Die zwischenge- 
speicherten Kopien werden spater in einem globalen Spei- 
cher mit dem gemeinsam verwendeten Datenblock verbun- 
aen. Mit jeder zwischengespeicherten Kopie wird ebenfalls 
eine Bitmaske, die aus einer Mehrzahl von Flags besteht, die 
Elementen der zwischengespeicherten Kopie zugeordnet 
sind,, in den lokalen Speichern gespeichert. Eine lokale 
Speichersteuerung verfolgt durch Setzen der Bitmasken- 
FJags, die solchen Elementen zugeordnet sind, weicne 
Elemente der zwischengespeicherten Kopien vera ndert wur- 
den. Beim Verbinden werden lediglich veranderte Elemente 
der zwischengespeicherten Kopien in dem urspninglichen 
Datenblock gespeichert, wie es durch die Bitmasken-Flags 
angezeigt ist. 
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Diese Erfindung bezieht sich im allgemeinen auf 
Computersysteme, bei denen in einem Speicher gespei- 
cherte Daten von mehreren Prozessoren global gemein- 
sam verwendet werden, und insbesondere bezieht sie 
sich auf Verfahren und eine Vorrichtung zum Beibehal- 
ten der Koharenz von gemeinsamen Daten, die bei ein- 
zelnen Prozessoren gespeichert sind. 

Bei Mehrprozessor-Computersystemen sind mehrere 
unabhangige Prozessoren miteinander verbunden, um 
die gleichzeitige Ausfuhrung von mehreren Prozessen, 
die Teile eines einzelnen Programms darstellen, zu er- 
moglichen. Solche Computersysteme konnen verwen- 
det werden, um mehrere getrennte Programme, die sich 
Daten oder Speichermittel teilen, auszufiihren. 

Multiprozcssor-Systeme mit gemeinsamem Speicher, 
bei denen die Daten in einem Speicher gespeichert sind, 
auf den durch alle Prozessoren global zugegriffen wer- 
den kann, bieten den Vorteil eines flachen Speichermo- 
dells, das durch viele Prograrnmierer bevorzugt wird. 
Bei Systemen mit einem flachen Speichermodeil kann 
auf die Daten durch einzelne Prozessoren zugegriffen 
werden, die eine globale virtuelle Adressierung verwen- 
den. Im Gegensatz dazu sind bei einigen Multiprozes- 
sor-Systemen mit verteiltem Speicher die Daten in Spei- 
chern gespeichert, auf die lediglich durch einzelne Pro- 
zessoren zugegriffen werden kann. Bei solchen Syste- 
men kann ein Prozessor lediglich auf Daten in einem 
Speicher eines anderen Prozessor zugreifen, indem er 
direkt mit einem Programm, das auf dem anderen Pro- 
zessor ablauft, in Verbindung tritt. Die Aufgabe des Pro- 
grammierers ist folglich komplexer, weii die Vorausset- 
zung geschaffen werden muB, um Meldungen zwischen 
Prozessoren auszutauschen und den Ort der Daten in 
den Prozessoren zu verfolgen. 

Bei vielen Multiprozessor-Systemen mit gemeinsa- 
mem Speicher ist jeder Prozessor mit einem lokalen 
Speicher oder Cache-Speicher zum schnelleren Spei- 
cherzugriff versehen. Weil der globale Speicher und die 
Prozessoren physikalisch voneinander entfernt ist, ist 
der direkte Zugriff auf Daten in dem globalen Speicher 
verhaltnismaBig langsam. Der Cache-Speicher schafft 
eine schnellere Zwischenspeicherstufe zur voruberge- 
henden Speicherung von gemeinsamen Daten, die ein 
Prozessor benotigt Wenn der Prozessor auf Daten ei- 
nes Datenblocks in dem globalen Speicher zugreift, wird 
der gesamte Datenblock iibertragen und in dem Cache- 
Speicher des Prozessors gespeichert Der anfangliche 
Datenzugriff ist immer noch langsam, nachdem der 
Block aus dem globalen Speicher erhalten werden muB, 
aber nachfolgende Zugriff e auf den gleichen Daten- 
block konnen mit der schnelleren Rate des Cache-Spei- 
chers durchgefuhrt werden. Die meisten Datenzugriffe 
durch einen Prozessor sind temporar und raumlich Toka- 
lisiert. D.h. wahrend einer gegebenen Zeitdauer wird ein 
Hauptanteil von Datenzugriffen durch einen Prozessor 
im selben Datenblock erfolgen. Durch das Zwischen- 
speichern im Cache-Speicher wird dementsprechend 
auf die Daten mit einer viel schnelleren Durchschnitts- 
rate zugegriffen, als wenn alle Datenzugriffe direkt iiber 
den globalen Speicher durchgefuhrt wurden. 

Bei Multiprozessor-Systemen mit gemeinsamem 
Speicher, die Cache-Speicher verwenden, muB jedoch 
ein weiteres Problem beachtet werden, namlich die Bei- 
behaltung der Cache-Speicher-Koharenz. Wenn mehre- 
re Prozessoren Kopien desselben Datenblocks haben 
und die irn Cache-Speicher gespeicherten Kopien durch 



einen oder mehrere der Prozessoren verandert werden, 
werden die in dem Cache-Speicher gespeicherten Da- 
tenblocke inkonsistent sein. Bei der Ausfuhrung der je- 
weiligcn Prozesse durch die Prozessoren kann dies feh- 
5 lerhafte Ergebnisse verursachen. 

Eine mangelnde Cache-Speicher-Koharenz tritt z. B. 
auf, wenn zwei Prozessoren in ihren jeweiligen Cache- 
Speichern Kopien desselben Datenblockes haben und 
beide dasselbe Datenelement in den Blocken verandern. 
io In einer solchen Situation sind die im Cache-Speicher 
gespeicherten Kopien des Prozessors zueinander und 
zu dem Datenblock im globalen Speicher inkonsistent. 
Abhangig davon, welche Kopie eines Prozessors den 
globalen Speicher zuletzt aktuaiisiert, wird das Daten- 
15 element in dem Datenblock im globalen Speicher den 
Wert haben, der durch einen Prozessor oder einen ande- 
ren geschrieben wurde (und nicht notwendigerweise 
den Wert, der tatsachlich zuletzt durch die Prozessoren 
geschrieben wurde). Dies wird manchmal als "Schreibe/ 
20 Schreibe-Datenwettlauf" (write/write data race) be- 
zeichnet. 

Eine mangelnde Cache-Speicher-Koharenz erfolgt 
ebenfalls, wenn ein erster Prozessor schreibt und ein 
zweiter Prozessor dasselbe Datenelement eines Daten- 
25 blocks liest. Abhangig davon, ob die im Cache-Speicher 
des zweiten Prozessors gespeicherte Kopie des Daten- 
blocks erhalten wird, bevor oder nachdem der Daten- 
block in dem globalen Speicher mit dem durch den er- 
sten Prozessor geschriebenen Wert aktuaiisiert ist, wird 
30 der zweite Prozessor den ursprunglichen Wert des Da- 
tenelements oder den Wert, der durch den ersten Pro- 
zessor geschrieben wurde, lesen. Dies wird manchmal 
als "Lese/Schreibe-Datenwettlauf" bezeichnet. 

Das Problem der Cache-Speicher-Koharenz wurde 
35 ausgiebig untersucht und es wurde eine Anzahl von L6- 
sungen vorgeschlagen. Eine Anzahl dieser Losungen ar- 
beitet durch Erzwingen einer Folgekonsistenz. Eine sol- 
che Losung besteht darin, das Speichern von gemeinsa- 
men Daten im Cache-Speicher einfach zu umgehen. Je- 
40 der Zugriff auf ein Datenelement, das mit anderen Pro- 
zessoren gemeinsam verwendet wird, wird direkt im 
globalen Speicher durchgefuhrt. Auf diese Art greifen 
die Prozessoren in einer strikten sequentiellen Art auf 
die gemeinsamen Daten zu. Diese Losung weist erhebli- 
45 che Geschwindigkeitsnachteile bei Systemen auf, bei 
denen direkte Zugriffe auf den globalen Speicher viel 
langsamer sind als Zugriffe auf in Cache-Speichern ge- 
speicherten Daten, oder bei denen eine groBe Menge 
von gemeinsamen Daten vorhanden ist 
so Eine weitere Variation der Folgekonsistenz, die hier 
als "ungultig machen beim Schreiben" bezeichnet wird, 
besteht darin, das gleichzeitige Speichern eines Daten- 
blocks im Cache-Speicher durch mehrere Prozessoren 
zu ermoglichen, erfordert es aber, daB jeder Prozessor, 
55 der den Datenblock schreibt, ein Ungultig-Signal an alle 
anderen Prozessoren in dem System sendet Die ande- 
ren Prozessoren mussen beim Empfangen des UngOltig- 
Signals eine aktualisierte Version des Datenblocks aus 
dem globalen Speicher anfordern, bevor sie weiter auf 
60 den Datenblock zugreifen. Eine weitere Variation der 
Folgekonsistenz, die hier als "Aktualisierung beim 
Schreiben" bezeichnet wird, erfordert es, daB der schrei- 
bende Prozessor jedesmal, wenn ein Schreiben durch- 
gefuhrt wird, seine Veranderungen des Datenblocks an 
65 die anderen Prozessoren in dem System sendeL 

Sowohl das "ungultig machen beim Schreiben"- und 
- das "Aktualisieren beim Schreiben"-Schema sind jedoch 
weniger effizienL Bei beiden Schemata werden Ungul- 
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tig- oder Aktualisierungs-Meldungen unnotigerweise 
gesendet, wenn Datenblocke falschlicherweise gemein- 
sam verwendet werden. In der Situation, die hier als 
"falsche gemeinsame Verwendung" bezeichnet wird, 
speichert mehr als ein Prozessor denselben Datenblock 5 
im Cache-Speicher, aber auf ein Datenelement, das 
durch einen schreibenden Prozessor verandert wird, 
wird durch einen anderen Prozessor nicht zugegriffen 
(lesen oder schreiben) (d. h. der Datenblock wird ge- 
' meinsam verwendet, aber das Datenelement nicht). So- 10 
lange kein Prozessor auf ein Datenelement, das durch 
einen anderen Prozessor verandert wurde zugreift, wird 
kein Konflikt erzeugt. Nachdem das faische gemeinsa- 
me Verwenden fiir einen groBen Anteil von Ungiiltig- 
und Aktualisierungs-Meldungen zutreffen kann, fuhren 15 
diese Schemata zu einem Anstieg von unndtigem Kom- 
munikationsverkehr. 

Der VerhaltenseinfluB einer falschen gemeinsamen 
Verwendung kann mit Cache-Speicher- Koharenzlosun- 
gen gemildert werden, die es ermogiichen, daB die Pro- 20 
zessoren voriibergehend inkonsistente im Cache-Spei- 
cher gespeicherte Kopien eines Datenblocks beibehal- 
ten. Diese inkonsistenten im Cache-Speicher gespei- 
cherten Kopien werden spater an programmierten Syn- 
ch ronisationspunkten in Einklang gebracht (d. h. Aktua- 25 
lisierungen werden durchgefuhrt) (Synchronisations- 
punkte konnen z. B. durch die Verwendung von geeig- 
neten Synchronisationsoperationen, wie z. B. Sperr- und 
Verriegelungs-Operationen, die in dem Programm an- 
geordnet sind, eingestellt werden). Diese Synchronisa- 30 
tionen miissen richtig programmiert sein, urn die oben 
beschriebenen "Schreibe/Schreibe-" und "Lese/Schrei- 
be-Datenwettlaufe" zu vermeiden. Zwischen den Syn- 
chronisationen konnen rnehrere Prozessoren jedoch 
verschiedene Abschnitte desselben Datenblocks in in- 35 
ren jeweiligen Cache-Speichern verandern. Dieser L6- 
sungsansatz, der hier als "verzogerte Konsistenz" be- 
zeichnet ist, reduziert den Kommunikationsverkehr, der 
der falschen gemeinsamen Verwendung zugeordnet ist 

Eine verzogerte Konsistenzlosung wird durch A. 40 
Karp und V. Sarkar in "Data Merging for Shared Me- 
mory Multiprocessors", HP Laboratories Technical Re- 
port, November 1992 vorgeschlagen. Bei Karp-Sarkar- 
Datenverbinden wird es mehr als einem Prozessor er- 
moglicht, eine Kopie eines Datenblocks im globalen 45 
Speicher in seinem Cache-Speicher zu speichern und 
getrennte Abschnitte ihrer jeweiligen im Cache-Spei- 
cher gespeicherten Kopie unabhangig zu verandern. Je- 
de im Cache-Speicher gespeicherte Kopie wird spater 
an den globalen Speicher zuruckubertragen und mit 50 
dem Datenblock verbunden. Das Verbinden der im Ca- 
che-Speicher gespeicherten Kopien und des Daten- 
blocks im globalen Speicher wird unter Verwendung 
einer Bitmaske durchgefuhrt, die eine Bit-Flag fiir jedes 
Byte des Datenblocks im globalen Speicher enthalt. Je- 55 
de Flag der Bitmaske zeigt an, ob ein zugeordnetes Byte 
des Datenblocks im globalen Speicher bei einer Verbin- 
dung verandert wurde. Die Bitmaske, deren Flags an- 
fanglich nicht gesetzt sind, wird dem Datenblock im 
globalen Speicher zugeordnet, wenn der Block zum er- eo 
sten Mai durch irgendeinen Prozessor im Cache-Spei- 
cher gespeichert wird. Eine im Cache-Speicher gespei- 
cherte Kopie, die durch einen Prozessor modifiziert 
wurde, die dann aus dem Cache-Speicher des Prozes- 
sors geloscht wurde (urn z. B. ihre Ersetzung durch eine 65 
Kopie eines weiteren Datenblocks zu ermogiichen), 
wird in den globalen Speicher zuruckubertragen, um mit 
dem urspriinglichen Datenblock im globalen Speicher 



verbunden zu werden. 

Jede modifizierte im Cache-Speicher gespeicherte 
Kopie wird mit dem urspriinglichen Datenblock durch 
Vergleichen jeder Flag der Bitmaske, die noch nicht 
gesetzt ist, des zugcordneten Bytes des urspriinglichen 
Datenblocks und des Bytes in einem entsprechenden 
Abschnitt der im Cache-Speicher gespeicherten Kopie 
verbunden. Wenn sich die Bytes unterscheiden, wurde 
das Byte in der im Cache-Speicher gespeicherten Kopie 
verandert Das veranderte im Cache-Speicher gespei- 
cherte Byte wird deshalb anstelle des Bytes des* ur- 
spriinglichen Datenblocks gespeichert. Die Flag, die die- 
sem Byte zugeordnet ist, wird ebenfalls gesetzt, um an- 
zuzeigen, daB es verandert wurde. Wenn jedoch die By- 
tes identisch sind, bleibt die Flag ungesetzt und das un- 
veranderte im Cache-Speicher gespeicherte Byte wird 
nicht im Datenblock im globalen Speicher gespeichert 
Dementsprechend konnen zwei oder rnehrere im Ca- 
che-Speicher gespeicherte Kopien des Datenblocks mit 
getrennten veranderten Abschnitten im globalen Spei- 
cher verbunden werden. 

Das Karp-Sarkar-Datenverbindungssystem enthalt 
ebenfalls einen Zahler fiir jeden Datenblock im globalen 
Speicher, der die Anzahl von Prozessoren nachverfolgt 
die Kopien des Blocks in ihren Cache-Speichern haben. 
Der Zahler wird fur jeden Prozessor, der eine Kopie des 
Blocks im Cache-Speicher speichert, erhoht Die Pro- 
zessoren benachrichtigen den globalen Speicher immer 
dann, wenn eine Kopie des Datenblocks aus ihren Ca- 
che-Speichern geloscht wird, sogar wenn dieser nicht 
verandert wurde, so daB der Zahler erniedrigt werden 
kann. Durch Nachverfolgen dieser Zahl kann die Bit- 
maske des Datenblocks reinitialisiert werden, wenn die 
Anzahl der Prozessoren, die Kopien des Datenblocks 
haben, auf Null zuruckgeht 

Ein Nachteil des Karp-Sarkar-Datenverbindungsan- 
satzes besteht darin, daB, sobald eine veranderte im Ca- 
che-Speicher gespeicherte Kopie mit einem Datenblock 
im globalen Speicher verbunden wurde, es keinern Pro- 
zessor gestattet werden kann, eine weitere Kopie des 
Blocks im Cache-Speicher zu speichern, bis die Verbin- 
dung vollstandig ist (d. h. alle in Cache-Speichern ge- 
speicherten Kopien des Blocks verbunden sind). Um 
soiche weiteren Speicherungen des Blocks in Cache- 
Speichern nach dem Beginn des Verbindens zu verhin- 
dern, ist ein Aussetzungsmechanismus vorgesehen. Ein 
Aussetzungsbit ist dem Datenblock im globalen Spei- 
cher zugeordnet Wenn eine im Cache-Speicher gespei- 
cherte Kopie anfangs mit dem Block verbunden wird 
und eine weitere Kopie des Blocks im Cache-Speicher 
bleibt, wird das Aussetzungsbit gesetzt Wahrend das 
Aussetzungsbit gesetzt ist, wird jede Anfrage beziiglich 
eines Zugriffs auf den Block in einer Aussetzungswar- 
tcschlange angeordnet Die Anfragen bleiben ausge- 
setzt, bis die Verbindung vollstandig ist (d. h. bis der 
Zahlwert der Prozessoren, die im Cache-Speicher ge- 
speicherte Kopien haben, auf Null reduziert ist), worauf- 
hin die Anfragen durchgefuhrt werden und das Bit ge- 
loscht wird. 

Das Verhindern eines weiteren Zugriffs auf einen Da- 
tenblock im globalen Speicher nach dem Beginn des 
Verbindens ist bei dem Karp-Sarkar-Datenverbin- 
dungsansatz notwendig, well ein Prozessor ein be- 
stimmtes Byte eines Datenblocks in dem globalen Spei- 
cher rnehrere Male zwischen den Synchronisations- 
punkten in Obereinstimmung mit seinem Programm 
ordnungsgemaB verandern kann, ohne einen Daten- 
wettlauf zu erzeugen. Zwischen solchen Veranderungen 
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muB die im Cache-Speicher gespeicherte Kopie des 
Prozessors des Blocks aus dem Cache-Speicher geloscht 
werden, so daB der Cache-Speicher verwendet werden 
kann, urn Kopien von anderen Blocken zu speichern. 
Sobald jedoch die veranderte im Cache-Speicher ge- 
speicherte Kopie geloscht ist, wird diese mit dem Block 
im globalen Speicher verbunden und die Flag, die dem 
modifizierten Byte zugeordnet ist, wird gesetzt Wenn 
es dem Prozessor ermoglicht wird, erneut eine Kopie 
. des Blocks in seinem Cache-Speicher zu speichern und 
das Byte zu modifizieren, kann es nicht ordnungsgemaB 
mit dem Datenblock im globalen Speicher verbunden 
werden. (Die weitere Veranderung des Bytes wird in 
dem globalen Speicher nicht gespeichert, weil das Da- 
tenbit bereits gesetzt ist). Der Aussetzungsmechanismus 
ermoglicht es dem Prozessor, dasselbe Byte vor der 
nachsten Synchronisation im Cache-Speicher zu spei- 
chern und zu verandern, aber nur nachdem das Verbin- 
den abgeschlossen ist und die dem Byte zugeordnete 
Flag geloscht ist 

Es ist die Aufgabe der vorliegenden Erfindung, ein 
Datenverbindungsverfahren und eine Vorrichtung zu 
schaffen, die die Anforderung ausschlieBt, daB Zugriffe 
bezuglich des Zugriffs auf einen Datenblock ausgesetzt 
werden, sobald das Verbinden der Datenblocke begon- 
nen hat 

Diese Aufgabe wird durch ein Verfahren zur gemein- 
samen Verwendung eines Speichers bei einem Compu- 
tersystem mit mehreren Prozessoren nach Anspruch 1 
und Anspruch 3, und durch ein Computersystem mit 
mehreren Prozessoren mit gemeinsamcm Speicher 
nach Anspruch 10 gelost 

GemaB der vorliegenden Erfindung wird die Daten- 
verbindung dadurch hergestellt, daB eine Bitmaske je- 
der im Cache-Speicher -gespeicherten Kopie eines ur- 
sprunglichen Datenblocks zugeordnet wird. Die Bitmas- 
ke umfaBt eine Mehrzahl von Flags, eine fOr jedes Da- 
tenelement in der im Cache-Speicher gespeicherten Ko- 
pie, um anzuzeigen, welche im Cache-Speicher gespei- 
cherte Kopie der Datenelemente verandert wurde. Die 
Bitmasken-Flags werden initialisiert, wenn die Kopie 
das erstemal im Cache-Speicher gespeichert wird. Wenn 
die Datenelemente der im Cache-Speicher gespeicher- 
ten Kopie verandert werden, werden deren zugeordne- 
te Flags auf einen geschriebenen Wert eingestellt 

Wenn die im Cache-Speicher gespeicherte Kopie da- 
nach aus dem Cache-Speicher geloscht wird, bestimmt 
die Bitmaske, welche Datenelemente der im Cache- 
Speicher gespeicherten Kopie im Datenblock im globa- 
len Speicher gespeichert werden. Jede im Cache-Spei- 
cher gespeicherte Kopie des Datenelements, deren zu- 
geordnete Flag anzeigt, daB diese verandert wurde, wird 
in dem Datenblock im globalen Speicher gespeichert 
Wahrend des Verbindens werden dementsprechend Da- 
tenelemente der im Cache-Speicher gespeicherten Ko- 
pie an den entsprechenden Stellen des ursprunglichen 
Datenblocks gespeichert, wenn die im Cache-Speicher 
gespeicherte Kopie der Datenelemente verandert ist, 
und nicht gespeichert, wenn die ursprunglichen Daten- 
blockelemente unverandert bleiben. Durch ein solches 
Schema kann ein Prozessor eine Kopie eines Blocks im 
globalen Speicher erfolgreich im Cache-Speicher spei- 
chern, diese verbinden und wiederum eine Kopie des 
Blocks im Cache-Speicher speichern, ohne darauf zu 
warten, daB der Verbinder fertig wird. 

Bei einem Ausfuhrungsbeispiel der Erfindung sind die 
im Cache-Speicher gespeicherten kopierten Datenele- 
mente, denen die Bitmasken-Flags zugeordnet sind, By- 



tes. (Die Bezeichnung "Byte" wird hier verwendet, um 
ein Mehr-Bit-Datenelement zu bezeichnen, das im allge- 
meinen, aber nicht notwendigerweise, sieben oder acht 
binare Stellen ("Bits") hat). Bei einem weiteren AusfGh- 
s rungsbeispiel der Erfindung sind die im Cache-Speicher 
gespeicherten kopierten Datenelemente, denen die Bit- 
masken-Flags zugeordnet sind, Datenworter. (Die Be- 
zeichnung "Datenwort" wird hier verwendet, um eine 
Einheit von Daten zu bezeichnen, die aus einer ganzzah- 

io ligen Anzahl von Bytes besteht, im allgemeinen, aber 
nicht notwendigerweise, vier Bytes). Durch Beibehalten 
einer Bitmaske mit Flags, die lediglich den Wortern der 
im Cache-Speicher gespeicherten Kopien zugeordnet 
sind, ist weniger Speicherraum in den Cache-Speichern 

is der Prozessoren zum Speichern der Bitmasken erfor- 
derlich. 

In Obereinstimmung mit einem weiteren Aspekt der 
Erfindung ist bei einem Ausfuhrungsbeispiel der Erfin- 
dung, bei dem die Bitmasken-Flags den im Cache-Spei- 

20 cher gespeicherten kopierten Datenwortern zugeord- 
net sind, ebenfalls eine Teilwort-Speicher-Flag der im 
Cache-Speicher gespeicherten Kopie zugeordnet Die 
Teilwort-Speicher-Flag wird initialisiert, wenn die Ko- 
pie im Cache-Speicher gespeichert wird und nachfol- 

25 gend gesetzt, wenn der Prozessor eine Teilwort-Spei- 
cher-Operation bezuglich der im Cache-Speicher ge- 
speicherten Kopie durchfiihrt (d. h. eine Operation, die 
weniger als das gesamte Wort speichert). Die im Cache- 
Speicher gespeicherte Kopie wird dann unter Verwen- 

30 dung einer Bitmaske, die eine Flag fur jedes Byte des 
Datenblocks im globalen Speicher hat, wie beim Karp- 
Sarkar-Datenverbindungsansatz verbunden. Die Bit- 
maske des globalen Speichers kann in einem dynamisch 
zugeordneten Speicher gespeichert werden. Dieser 

35 Aspekt der Erfindung reduziert den Cache-Speicher- 
Speicherplatzmehraufwand, wahrend Teilwort-Spei- 
cherzugriffe ermoglicht werden. 

GemaB eines weiteren Aspekts der Erfindung sind 
eine Lese-Bitmaske und eine Schreibe-Bitmaske in dem 

40 Cache-Speicher enthalten. Jede der Lese- und Schreibe- 
Bitmasken enthalt eine Flag fur jedes im Cache-Spei- 
cher gespeicherte kopierte Datenelement, die gesetzt 
wird, wenn das zugeordnete Datenelement gelesen bzw. 
geschrieben wird. Nachdem die im Cache-Speicher ge- 

45 speicherte Kopie mit dem Datenblock im globalen Spei- 
cher verbunden ist, werden die Bitmasken gespeichert, 
so daB das Auftreten eines Lese/Schreibe- oder Schrei- 
be/Schreibe-Datenwettlaufes zur Fehlerbeseitigung 
Oder aus anderen Grunden identifiziert werden kann, 

so GemaB einem weiteren Aspekt der Erfindung ist je- 
dem Datenblock im globalen Speicher eine Sperr-Flag 
zugeordnet Die Sperr-Flag wird bei der Anfrage eines 
sperrenden Prozessors gesetzt. Wenn die Sperr-Flag 
gesetzt ist, werden weitere Anfragen bezuglich des Zu- 

55 griffs auf den Datenblock in einer Anfrageaussetzungs- 
warteschlange angeordnet Die Sperr-Flag kann ledig- 
lich auf die Anfrage des sperrenden Prozessors gel5scht 
werden, woraufhin die ausgesetzten Anfragen verarbei- 
tet werden. 

60 Wiederum gemaB eines weiteren Aspekts der Erfin- 
dung werden Reduktionsoperationen bezuglich der Da- 
ten im globalen Speicher durchgefuhrt Solche Reduk- 
tionsoperationen bezuglich der Daten im globalen Spei- 
cher konnen durch eine Steuerung des globalen Spei- 

65 chers durchgefuhrt werden. 

GemaB einem weiteren Aspekt der Erfindung ist in 
einem Computersystem mit mehreren globalen Spei- 
chereinheiten eine Kopie eines Datenblocks, der in ei- 
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nern ersten globalen Speicher gespeichert ist, ebenfalls 
in einem zweiten globalen Speicher gespeichert. Die 
Prozessoren konnen dann im Cache-Speicher gespei- 
cherte Kopien des Datenblocks aus einer der globalen 
Speichereinheiten erhalten. Wenn alle im Cache-Spei- 
cher gespeicherten Kopien wieder rnit den Kopien des 
Datenblocks im globalen Speicher verbunden wurden, 
werden die Kopien im globalen Speicher ebenfalls ver- 
bunden. Bevorzugterweise sind die mehreren globalen 
Speichereinheiten in einer Hierarchie angeordnet und 
die Kopien in dem globalen Speicher werden mit einer 
nachst hoheren Slufe des globalen Speichers verbun- 
den. Dieser Aspekt kann angewendet werden, wenn auf 
den Datenblock eines globalen Speichers durch eine 
groBe Anzahl von Prozessoren zugegriffen wird, urn die 
Uberlastung dieses globalen Speichers zu verhindern, 
wahrend die anderen nicht verwendet werden. 

Bevorzugte Ausfuhrungsbeispiele der' vorliegenden 
Erfindung werden nachfolgend unier Bezugnahme auf 
die beiliegenden Zeichnungen gcnauer beschrieben. Es 
2eigen: 

Fig. 1 eine schematische Darstellung eines Multipro- 
zessor-Computersystems mit gemeinsamem Speicher 
gemaB der vorliegenden Erfindung; 

Fig. 2 eine Darstellung gemaB einem ersten Ausfiih- 
rungsbeispiel der Erfindung, die die Beziehung zwischen 
den Flags in einer Schreibe-Bitmaske und Datenele- 
menten eines im Cache-Speicher gespeicherten Daten- 
blocks, der in einem lokalen Speicher des Computersy- 
stems aus Fig. 1 gespeichert ist, darstellt; 

Fig. 3 eine Darstellung gemaB einem zweiten, dritten 
und neunten Ausfuhrungsbeispiel der Erfindung, die die 
Beziehung der Schreibe-Bitmasken-Flags zu Datenele- 
menten eines im Cache-Speicher gespeicherten Daten- 
blocks, der in dem lokalen Speicher des Computersy- 
stems aus Fig. 1 gespeichert ist, darstellt; 

Fig. 4 eine Darstellung, gemaB einem dritten und 
vierten Ausfiihrungsbeispiel der Erfindung, die eine glo- 
bale Schreibe-Bitmaske, eine Aussetzungs/Sperr-Flag, 
eine Aussetzungswarteschlange und einen Zahlstand, 
die einem Datenblock zugeordnet sind und in einem 
globalen Speicher des Computersystems aus Fig. 1 ge- 
speichert sind, darstellt; 

Fig. 5 eine Darstellung gemaB einem funften Ausfiih- 
■ rungsbeispiel der Erfindung, die lokale und globale 
- Schreibe- und Lese/Bitmasken darstellt, die in dem loka- 
len Speicher und dem globalen Speicher des Computer- 
systems aus Fig. 1 zur Identifikation von Datenfehlern 
gespeichert sind; 

Fig. 6 eine Darstellung gemaB einem siebten Ausfuh- 
rungsbeispiel der Erfindung, die eine hierarchische An- 
ordnung von Prozessoren und globalen Speichereinhei- 
ten in dem Computersystem aus Fig. 1 darstellt; 

Fig. 7 eine Darstellung gemaB einem achten Ausfiih- 
rungsbeispiel der Erfindung, die eine globale Schreibe- 
Bitmaske, eine spezieile Verb inder- Flag und eine Tabel- 
le darstellt, die einem Datenblock zugeordnet sind und 
in einem globalen Speicher des Computersystems aus 
Fig. 3 gespeichert sind; und 

Fig. 8 ein verallgemeinertes Blockdiagramrn gemaB 
einem neunten Ausfuhrungsbeispiel der Erfindung, das 
die internen Register und Bit-Veranderungs-Flags einer 
CPU in dem Computersystem aus Fig. 1 darstellt. 

In Fig. 1 ist ein erstes Ausfuhrungsbeispiel der vorlie- 
genden Erfindung dargestellt, bei dem ein Multiprozes- 
sor-Computersystem 20 mit gemeinsamem Speicher ei- 
ne Mehrzahl von Prozessoren 22—24 und eine oder 
mehrere globale Speichereinheiten 26, 27 umfaBt. Ein 
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Verbindungskommunikationsmediurn 28, wie z. B. ein 
Bus, ein Kreuzschienenwahler, ein mehrstufiges Netz- 
- werk, ein lokales Netzwerk oder ahnliches verbindet die 
Prozessoren 22—24 und die globalen Speichereinheiten 
5 26, 27. Das Kommunikationsmedium 28 wird verwendet, 
um Daten zwischen den Prozessoren 22 — 24 und den 
globalen Speichereinheiten 26, 27 zu ubertragen. 

Jede globale Speichereinheit 26, 27 hat eine globale 
Speichersteuerung 30, 31 und einen globalen Speicher 
io 32,33. Die globalen Speicher 32, 33 stellen den Speicher- 
platz fiir Daten bereit, die durch die Prozessoren 22—24 
gemeinsam verwendet werden sollen und konnen eben- 
falls Daten speichern, die sich auf die Datenverbindung 
beziehen. Die globalen Speichersteuerungen 30, 31 rea- 
ls gieren auf globale Speicheranfragen der Prozessoren 
und fiihren Datenverbindungsoperationen aus. Die glo- 
balen Speichersteuerungen 30, 31 konnen als Zustands- 
maschine ausgefiihrt sein. Die Steuerung 30, 31 sind je- 
doch bevorzugterweise mil allgemeinen Verarbeitungs- 
20 schaltungen ausgefiihrt, die programmiert sind, um ge- 
maB der Erfindung wirksam zu sein. 

Jeder der Prozessoren 20—24 hat eine zentrale Ver- 
arbeitungseinheit 36—38, eine lokale Speichersteue- 
rung 40—42 und einen lokalen oder Cache-Speicher 
25 44—46. Die Prozessoren 22—24 fiihren einzeln Prozes- 
se in ihren jeweiligen zentralen Verarbeitungseinheiten 
36—38 aus, die einen Teil einer gemeinsamen program- 
mie'rten Aufgabe darstellen. Wenn ein ProzeB, der in 
einer zentralen Verarbeitungseinheit 36—38 eines Pro- 
30 zessors ausgefiihrt wird, Zugriff auf gemeinsam verwen- 
dete Daten, die in einer der globalen Speichereinheiten 
26, 27 gespeichert sind, benotigt, gibt die Lokaispeicher- 
steuerung 40—42 des Prozessors eine Datenabfrage an 
die globale Speichereinheit aus. Daten, die durch einen 
35 der Prozessoren 22—24 von den globalen Speicherein- 
heiten 26, 27 erhalten werden, werden in dessen lokalen 
Speichern 44—46 gespeichert 

Die gemeinsamen Daten, die in den globalen Spei- 
chern 32, 33 gespeichert sind, umfassen eine Mehrzahl 
40 von Datenblocken, wobei jeder Datenblock im allge- 
meinen aus einer Anzahl von Bytes besteht. Um die 
durchschnktliche Zeitdauer zu reduzieren, die erforder- 
lich ist, um auf die gemeinsamen Daten zuzugreifen, 
wird es den Prozessoren 22—24 ermoglicht, Kopien der 
45 gemeinsamen Datenblocke in ihren lokalen Speichern 
44— 46 zwischenzuspeichern. Bevorzugterweise sind die 
lokalen Speicher 44—46 Halbleiterspeicher vom Typ 
des wahlfreien Zugriffs, die schnellere Zugriffszeiten, 
die der Befehlsausfuhrungsgeschwindigkeit der zentra- 
50 len Verarbeitungseinheiten 36—38 entsprechen, bereit- 
stellen konnen. Die globalen Speichermodule 32, 33 
konnen ebenfalls relativ schnelle Speicher vom Haiblei- 
tertyp sein, konnen aber langsarnere Massenspeicherge- 
rate, wie z. B. Datenspeichergerate, die optische oder 
55 magnetische Medien verwenden, einschlieBen. Wenn 
dementsprechend eine zentrale Verarbeitungseinheit 
36—38 eines Prozessors 22—24 Zugriff auf gemeinsame 
Daten in einer globalen Speichereinheit 26—27 erfor- 
dert, gibt die lokale Speichersteuerung 40—42 des Pro- 
60 zessors eine Datenabfrage an die globale Speicherein- 
heit aus. Die globale Speichersteuerung 30, 31 in der 
globalen Speichereinheit reagiert durch Obertragen ei- 
ner Kopie des Datenblocks, der die angeforderten Da- 
ten en t hah, an den Prozessor. Die lokale Speichersteue- 
65 rung 40, 42 des Prozessors speichert dann die Daten- 
blockkopie in dem lokalen Speicher 44—46 des Prozes- 
sors. 

Bei dem Computersystem 20 konnen rnehr als ein 
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Prozessor 20—24 Kopien desselben Datenblocks im 
globalen Speicher in ihren lokalen Speichern 44—46 
zwischenspeichern und Abschnitte solcher Kopien un- 
abhangig verandern. Als ein Ergebnis der unabhangigen 
Veranderung der zwischengespeicherten Kopien kon- 
nen sich die Kopien voneinander unterscheiden. Diese 
Unterschiede zwischen den zwischengespeicherten Ko- 
pien werden durch die im folgenden beschriebene Da- 
tenverbindung geldst 

Nachdem die Kopien eines gemeinsamen Daten- 
blocks durch mehrere Prozessoren in dem Computersy- 
stem 20 zwischengespeichert und verandert werden 
konnen, konnen Lese/Schreibe- und Schreibe/Schreibe- 
Datenwettlaufe erzeugt werden. Diese Wettlaufe wer- 
den bei dem Computersystem 20 durch Programmie- 
rung der Prozesse, die auf den Prozessoren 20—24 ab- 
laufen, mit geeigneter Synchronisation vermieden. Um 
Schreibe/Schreibe-Datenwettlaufe zu vermeiden, miis- 
sen die Prozesse richtig programmiert sein, so daB keine 
zwei Prozessoren ein gleiches Datenelement zwischen 
programmierten Synchronisationspunkten verandern 
konnen. Der Programmierer sollte ebenfalls sicherstel- 
len, daB kein Prozessor ein Datenelement des gemeinsa- 
men Blocks liest, der ebenfalls durch einen anderen Pro- 
zessor zwischen programmierten Synchronisations- 
punkten verandert (d. h. geschrieben) wurde. DaB mehr 
ais ein Prozessor ein gleiches gemeinsames Datenele- 
ment zwischen Synchronisationen verandert, tritt in 
dem Computersystem 20 folglich lediglich als ein Ergeb- 
nis eines Fehlers des Programmierers auf. Die Synchro- 
nisation der Zugriffe auf ein gemeinsames Datenele- 
ment kann z. B. durch herkommliche Sperr- oder Ver- 
riegelungs-Befehl oder anderen damit verbundenen 
Mechanismen durchgefuhrt werden. 

Wie in Fig. 2 dargestellt ist, wird die Datenverbin- 
dung gemaB dem ersten Ausfuhrungsbeispiel der Erfin- 
dung durch Nachverfolgen, welche Datenelemente ei- 
ner zwischengespeicherten Kopie verandert wurden, 
erreicht. Wenn die lokale Speichersteuerung 40 (Fig. 1) 
eine Kopie 54 eines Datenblocks (der "ursprungliche 
Datenblock") aus der globalen Speichereinheit 26 in 
dem lokalen Speicher 44 speichert, speichert bei dem 
Computersystem 20 die Steuerung ebenfalls eine 
Schreibe-Bitmaske 56 in dem lokalen Speicher. Die 
Schreibe-Bitmaske 56 besteht aus einer Mehrzahl von 
Flags 60—64, eine fiir jedes einer Mehrzahl von Daten- 
elementen 70—74 in der Kopie 54. Die Flags 60—64 
sind in einer 1 : 1-Beziehung den Datenelementen 
70—74 zugeordnet, wie es durch die Pfeile in Fig. 2 
dargestellt isL Bei dem Ausfuhrungsbeispiel, das in 
Fig. 2 dargestellt ist, ist jede Flag ein einzelnes Bit, kann 
aber bei alternativen Ausfuhrungsbeispielen mehrere 
Bits umfassen. Bei dem dargestellten Ausfiihrungsbei- 
spiel sind die Datenelemente, die den Bitmasken-Flags 
1 : 1 zugeordnet sind, ebenfalls Bytes. Wie es jedoch in 
dem Ausfuhrungsbeispiel, das in Fig. 3 dargestellt ist 
und das im folgenden beschrieben wird, gezeigt ist, k6n- 
nen die Datenelemente, die den Bitmasken-Flags 1 : 1 
zugeordnet sind, Worter oder Dateneinheiten mit ir- 
gendwelchen anderen GroBen sein, die zusammen die 
zwischengespeicherte Kopie bilden. 

Die lokale Speichersteuerung 40 verfolgt durch Set- 
zen der Flags 60—64, die den Datenelementen, die ver- 
andert sind, zugeordnet sind, ob Datenelemente 70—74 
der zwischengespeicherten Kopie 54 verandert wurden. 
Die lokale Speichersteuerung 40 setzt die Flags 60—64 
anfanglich auf einen nicht-geschriebenen Wert (d. h. ein 
Wert, der anzeigt, daB seine zugeordneten Datenele- 
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mente 70—74 nicht verandert wurden), Bei dem darge- 
stellten Ausfuhrungsbeispiel ist der nicht-geschriebene 
Wert der einzelnen Bit-Flags 60—64 NulL Wenn die 
zentrale Verarbeitungseinheit 36 spater irgcndeines der 
5 Datenelemente 70—74 verandert, setzt die lokale Spei- 
chersteuerung 40 die Flags, die solchen veranderten Da- 
tenelementen zugeordnet sind, auf einen veranderten 
Wert (z. B. Eins bei dem dargestellten Ausfuhrungsbei- 
spiel). Wenn die zentrale Verarbeitungseinheit 36 z, B. 
io die Datenelemente 71 und 72 durch Schreiben dieser 
Elemente verandert, werden die jeweiligen zugeordne- 
ten Flags 61, 62 auf Eins gesetzt Als ein Ergebnis zeigen 
die Bitmasken-Flags 60—64 an, welches der Datenele- 
mente 70—74 der zwischengespeicherten Kopie veran- 
15 dert wurde. 

Wenn die zwischengespeicherte Kopie 54 aus dem 
lokalen Speicher geloscht wird, ubertragt die lokale 
Speichersteuerung 40 die Bitmaske 56 und die zwi- 
schengespeicherte Kopie 54 an die globale Speicherein- 
20 heit 26. Das Loschen der zwischengespeicherten Kopie 
54 tritt z. B. auf, wenn die lokale Speichersteuerung 40 
die zwischengespeicherte Kopie mit einer anderen Da- 
tenblockkopie ersetzt, so daB die zentrale Verarbei- 
tungseinheit 36 auf Daten in der anderen Datenblockko- 
25 pie zugreifen kann. Einige Synchronisationsmechanis- 
men konnen ebenfalls das Loschen der zwischengespei- 
cherten Kopie 54 durch Senden eines Ungultig-Signals 
an die lokale Speichersteuerung 40 ausldsen. Bei einigen 
Ausfuhrungsbeispielen kann die lokale Speichersteue- 
30 rung 40 lediglich so viele Informationen ubertragen, die 
zur Datenverbindung notwendig sind, wodurch der 
Kommunikationsmehraufwand reduziert wird, die 
Steuerung ubertragt z. B. die Bitmaske 56 und lediglich 
diejenigen Datenelemente der zwischengespeicherten 
35 Kopie 54, die verandert wurden. 

In der globalen Speichereinheit 26 verwendet die glo- 
bale Speichersteuerung 30 (Fig. 1) die Bitmaske 56 beim 
Vcrbindcn der zwischengespeicherten Kopie 54 mit ih- 
rem ursprunglichen Datenblock. Fiir jede der Flags 
40 60—64 der Bitmaske 54, die auf den veranderten Wert 
eingestellt ist, speichert die globale Speichersteuerung 
30 die zugeordneten Datenelemente 70— 74 der zwi- 
schengespeicherten Kopie in dem ursprunglichen Da- 
tenblock. Nachdem z. B. die Flags 61, 62 in der Darstel- 
45 lung von Fig. 2 auf Eins gesetzt sind (d. h. den verander- 
ten Wert), werden die zugeordneten Datenelemente 71, 
72 an entsprechende Stellen des ursprunglichen Daten- 
blocks gespeichert Dies bewirkt eine konsistente Ver- 
bindung in dem Datenblock des globalen Speichers mit 
so mehreren zwischengespeicherten Kopien, nachdem Ie- 
diglich die veranderten Abschnitte der zwischengespei- 
cherten Kopien den Datenblock aktualisieren und Pro- 
grammierungshindernisse mehr als einem Prozessor 
verbieten, denselben Abschnitt des Datenblocks zu ver- 
55 andern. 

Wie in der Beschreibungseinleitung beschrieben wur- 
de, besteht ein Nachteil des bekanmen Karp-Sarkar- 
Datenverbindungsansatzes darin, daB ein Prozessor 
daran gehindert wird, ein Element eines zwischenge- 
eo speicherten Datenblocks zu verandern, den Block zu 
verbinden und den Datenblock wieder zwischenzuspei- 
chern, bevor alle Kopien des Blocks verbunden wurden. 
Dies liegt daran, daB der Prozessor wiederum dasselbe 
Element im Datenblock verandern konnte und eine sol- 
65 che weitere Veranderung wurde durch eine Datenver- 
bindung nach Karp-Sarkar nicht im globalen Speicher 
gespeichert werden. Beim Karp-Sarkar-Datenverbin- 
den verfolgt eine Bitmaske im globalen Speicher, wel- 
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che Elemente des giobalen Blocks verandert sind. Ele- 
mente einer zwischengespeicherten Kopie werden le- 
diglich gespeichert, wenn sie sich von einem bisher un- 
veranderten Element an einer entsprechenden Stelle 
des giobalen Blocks unterscheiden. Genauer gesagt ak- 
tualisiert eine Veranderung eines Datenelements durch 
einen Prozessor in dessen erster zwischengespeicherter 
Kopie eines Datenblocks das Element an der entspre- 
chenden StelJe des giobalen Blocks und seizt eine zuge- 
' ordnete Flag. Sobald die Flag gesetzt ist, konnen keine 
weiteren Anderungen des Elements den giobalen Block 
aktualisieren, bis alle zwischengespeicherten Kopien 
des Blocks vcrbunden sind und die Flag zuruckgesetzt 
ist. Aus diesem Grund verwendet das Karp-Sarkar-Da- 
tenverbindungssystem einen Aussetzungsmechanismus, 
der jeden Prozessor daran hindert, den Datenblock 
nach seiner ersten Verbindung zwischenzuspeichern, bis 
alle bisher zwischengespeicherten Kopien des Blocks 
ebenfalls verbunden wurden. 

Mehrere Modifikationen eines Datenelements durch 
denselben Prozessor zwischen Synchronisationen sind 
jedoch bei Systemen, die eine verzogerte Konsistenz 
( verwenden, zulassig. Lediglich die Modifikation dessel- 
ben Datenelements durch mehr als einen Prozessor 
wird als Fehler betrachtet. Der Karp-Sarkar-Datenver- 
bindungsansatz bewirkt dann eine unerwiinschte, will- 
kurlich lange Verzogerung der Prozessoren, die dassel- 
be Element eines Datenblocks wiederum verandern 
miissen, nachdem ihre erste zwischengespeicherte Ko- 
pie des Blocks geloscht wurde. 

Bei dem Datenverbindungsansatz der vorliegenden 
Erfindung kann ein Prozessor einen Datenblock belie- 
big oft zwischenspeichern und verandern. Alle veran- 
derten Elemente einer zwischengespeicherten Kopie 
werden immer gespeichert Deshalb ist es nicht notwen- 
dig, den Prozessor daran zu hindern, Kopien eines Da- 
tenblocks nach dem Beginn der Verbindung, aber bevor 
diese abgeschlossen ist, zwischenzuspeichern. Folglich 
wird kein Aussetzungsrnechanisrnus benotigt. 

GemaB einem zweiten Ausfuhrungsbeispiel, wie in 
Fig. 3 dargestellt ist, verfolgen die lokalen Speicher - 
steuerungen 40—42 in dem Computersystem 20 unter 
Verwendung einer "Wort"-Schreibe-Bitmaske 88, die 
Flags 90—92 aufweist, die in einer 1 : 1-Beziehung den 
( ' , Wortern 80—82 zugeordnet sind, welche Worter 
' 80—82 einer zwischengespeicherten Kopie 86 modifi- 
ziert sind. Jedes Wort 80—82 besteht aus einer ganzzah- 
ligen Anzahl von Bytes 96—107 (z. B. vier Bytes pro 
Wort bei dem Ausfuhrungsbeispiel, das in Fig. 3 darge- 
stellt ist). Urn nachzuverfolgen, welche Worter veran- 
dert sind, sind die Flags 90—92 anfanglich auf einen 
nicht-geschriebenen Wert eingestellt Wenn die Worter 
80—82 in der zwischengespeicherten Kopie 86 veran- 
dert sind, werden dann ihre jeweiligen zugeordneten 
Flags 90— 92 auf einen geschriebenen Wert gesetzt. Wie 
es z. B. in Fig. 3 dargestellt ist, wird die Flag 91, wenn die 
Flags 90—92 anfanglich auf Null gesetzt sind, auf Eins 
gesetzt, wenn das Wort 81 verandert ist, wodurch ange- 
zeigt ist, daB es verandert wurde. 

Durch Zuordnen der Flags 90—92 zu Wortern der 
zwischengespeicherten Kopie wird der Speicherplatz- 
mehraufwand, der der Nachverfolgung von Vcrande- 
rungen von zwischengespeicherten Kopien zugeordnet 
ist, bei dem zweiten Ausfuhrungsbeispiel reduziert. Das 
erste in Fig. 2 gezeigte Ausfuhrungsbeispiel, bei dem 
eine Bitmasken-Flag fur jedes Byte der zwischengespei- 
cherten Kopie beibehalten wird, erfordert durch Ver- 
gleich etwa viermal mehr Speicherplatz fur die Bitmas- 
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ken-Flags. Die Beibehaltung einer Flag pro Wort ist 
besonders vorteilhaft, wenn die zentralen Verarbei- 
tungseinheiten 36—38 in Inkrementen der WortgroBe 
auf die Daten zugreifen. Bei solchen zentralen Verarbei- 
5 tungscinheiten, die weit verbreitet sind, ist die Nachver- 
folgung, welche Bytes 96—107 in der zwischengespei- 
cherten Kopie 86 verandert sind, mitteis einer Flag pro 
Byte in der Bitrnaske 88 redundant. 
Bei einem alternativen ("dritten") Ausfuhrungsbei- 
io spiel der Erfindung, das in Fig. 3 dargestellt ist, das eine 
Wort-Schreibe- Bitrnaske 88 beibehalt, ist eine Teilwort- 
Speicher-Flag 110 der zwischengespeicherten Kopie 26 
zugeordnet, um Teilwort-Speicher-Operationen anzu- 
passen. Einige zentraie Verarbeitungseinheiten 36—38, 
is die normalerweise auf die Daten durch das Wort zu- 
greifen, sind ebenfalls fahig, Operationen durchzufuhren 
(im folgenden Teilwort-Speicher-Operationen" ge- 
nannt), die Daten in Inkrementen von weniger als einem 
Wort verandern (z. B. die lediglich ein Byte zu einem 
20 Zeitpunkt verandern). Bei einem Computersystem 20, 
das solche zentraie Verarbeitungseinheiten verwendet, 
ist es wiinschenswert, die Datenverbindung auf der 
Wortstufe normal durchzufuhren, um den Speicher- 
platz- und den Ubertragungs-Mehraufwand zu reduzie- 
25 ren, wobei jedoch eine Datenverbindung auf der Byte- 
Stufe vorgesehen ist, wenn Teilwort-Speicher-Opera- 
tionen verwendet werden. 

Wenn die zwischengespeicherte Kopie 86 dement- 
sprechend in dem lokalen Speicher 44 gespeichert ist, 
30 speichert die lokale Speichersteuerung 40 ebenfalls die 
Teilwort-Speicher-Flag 110 in dem lokalen Speicher 44. 
Wenn die Flag 1 10 gespeichert ist, wird diese anfanglich 
auf einen "keine Teilwort-Speicherung aufgetre- 
ten"-Wert gesetzt, der anzeigt, daB keine Teilwort-Spei- 
35 cher-Operationen bezuglich der zwischengespeicherten 
Kopie 86 durchgefuhrt wurden. Zu solchen Zeitpunkten, 
zu denen die zentraie Verarbeitungseinheit eine Teil- 
wort-Speicher-Operation durchfuhrt, setzt die lokale 
Speichersteuerung 40 die Teilwort-Speicher-Flag auf ei- 
40 nen 'Teilwort-Speicherung aufgetreten M -Wert, der ein 
solches Auftreten anzeigt Die Steuerung40 setzt eben- 
falls die Wort-Schreibe-Bitmasken-FIag, die dem Wort, 
das durch die Teilwort-Speicher-Operation verandert 
wurde, zugeordnet ist, auf den geschriebenen Wert. Bei 
45 dem dargestellten Ausfuhrungsbeispiel ist die Teilwort- 
Speicher-Flag ein einzelnes Bit, der "keine Teilwort- 
Speicherung aufgetreten"-Wert ist Null und der Teil- 
wort-Speicherung aufgetretcn"-Wert ist Eins. Wenn die 
zentraie Verarbeitungseinheit 36 z. B. eine Teilwort- 
50 Speicher-Operation durchfuhrt, die Daten in das Byte 
102 schreibt, das ein Teil des Worts 81 ist, setzt die 
lokale Speichersteuerung die Teilwort-Speicher-Flag 
110 auf Eins und setzt ebenfalls die Schreibe-Bitmaske- 
Flag 91, die dem Wort 81 zugeordnet ist, auf Eins. Der 
55 Zustand der Wort-Bitmasken- und Teilwort-Speicher- 
Flags nach einer Teilwort-Speicher-Operation veran- 
dert das Byte 102, wie es in Fig. 3 dargestellt ist. 

Wenn die zwischengespeicherte Kopie 86 nachfol- 
gend aus dem lokalen Speicher 44 geloscht wird, uber- 
eo tragt die lokale Speichersteuerung 40 die zwischenge- 
speicherte Kopie 86, die zwischengespeicherte Kopie 
der Schreibe- Bitrnaske 88 und die Teilwort-Speicher- 
Flag 110 an die globale Speichereinheit 26, bei der der 
ursprungliche Datenblock 118 gespeichert ist. Wenn die 
65 Teilwort-Speicher-Flag 110 auf den "keine Teilwort- 
Speicherung aufgetreten"-Wert eingestellt ist, wird die 
gespeicherte Kopie 86 mit dem urspninglichen Daten- 
block 118 durch Speichern jedes Wortes 80—82, dessen 
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zugeordnete Flag 90—92 in der Wort-Schreibe-Bitmas- 
ke 88 auf den geschriebenen Wert gesetzt ist, an den 
entsprechenden Stellen des ursprunglichen Daten- 
blocks gespeichert Wenn jedoch die Teilwort-Speicher- 
Flag 110 auf den Teilwort-Speicherung aufgetre- 
ten w -Wen gesetzt ist, werden lediglich die veranderten 
Bytes der zwischengespeicherten Kopie 36 verbunden. 

Um lediglich die veranderten Bytes zu verbinden, 
speichert die globale Speichersteuerung 30 eine Teil- 
- wort-Schreibe-Bitmaske in dem globalen Speicher, die 
im allgemeinen aus einer Flag fur jedes Byte des ur- 
sprunglichen Datenblocks besteht, wobei jede Flag an- 
fanglich auf einen nicht-geschrieben Wert gesetzt ist. 
Fur jedes Wort 80—82 der zwischengespeicherten Ko- 
pie 86, deren zugeordnete Wort-Schreibe-Bitmasken- 
Flag 90 — 92 auf den geschriebenen Wert gesetzt ist, 
vergleicht die globale Speichersteuerung 30 die Bytes 
eines solchen Wortes mit den Bytes an den entsprechen- 
den Stellen des ursprunglichen Datenblocks. Wenn sich 
die Bytes unterscheiden und die Teilwort-Schreibe-Bit- 
masken-Flag, die dem ursprunglichen Blockbyte zuge- 
ordnet ist, immer noch auf den nicht-geschriebenen 
Wert gesetzt ist, speichert die globale Speichersteue- 
rung 30 die zwischengespeicherte Kopie des Bytes an- 
stelle des ursprunglichen Datenblockbytes und setzt die 
Flag in der globalen Schreibe-Bitmaske, die dem ur- 
sprunglichen Datenblockbyte zugeordnet ist, auf den 
geschriebenen Wert. Zusatzlich werden Kopien des Da- 
tenblocks, die in anderen Prozessoren 23— 24zwischen- 
gcspeichert sind, nachfolgend auf eine ahnliche Art und 
Weise verbunden. 

Ein ursprunglicher Datenblock 118 der zwischenge- 
speicherten Kopie 86 (Fig. 3) enthalt z. B„ wie es in 
Fig. 4 dargestellt ist, Worter 120—122 an Stellen, die 
denjenigen der Worter 80—82 (Fig. 3) entsprechen. 
Wenn die Teilwort-Speicher-Flag 110 (Fig. 3) auf Eins 
gesetzt ist, wodurch angezeigt ist, daB eine Teilwort- 
Speicher-Operation bezuglich der Kopie 86 durchge- 
fiihrt wurde, werden die Kopie 86 und der Block 118 
unter Verwendung einer globalen Schreibe-Bitmaske 
124 verbunden. Die Bitmaske 124 umfaBt eine Flag 
126—137 fur jedes Byte 146-157 des Blocks 118. Die 
Verbindung wird durch Vergleichen der Bytes 100—103 
(Fig. 3) jeder veranderten, zwischengespeicherten Ko- 
pie des Wortes 81 (angezeigt durch die zugeordnete 
Flag 91, die auf Eins gesetzt ist) mit denjenigen Bytes 
150 — 153 an den entsprechenden Stellen des Blocks 118 
bewirkt, deren zugeordnete Flags 130 — 133 immer noch 
auf Null gesetzt sind (wodurch angezeigt ist, daB sie 
noch nicht verandert sind). Die Bytes 100— 103, die sich 
von den Bytes 150— 153 unterscheiden, deren zugeord- 
nete Flags 130—133 auf Null gesetzt sind, werden ge- 
speichert und die zugeordneten Flags werden auf Eins 
gesetzt 

Bevorzugterweise ordnet die globale Speichersteue- 
rung 30 der Teilwort-Schreibe- Bitmaske dynamisch 
Speicherplatz aus einem freien Speicherabschnitt des 
globalen Speichers zu. Dies dient dazu, den Speicher- 
platzmehraufwand zu minimieren, nachdem eine Teil- 
wort-Schreibe- Bitmaske fur einen Datenblock in dem 
globalen Speicher nur gespeichert wird, wenn sie zur 
Datenverbindung erforderlich ist 

Mit dieser Art der Teilwort-Datenverbindung wird 
ein verandertes Byte in einer zwischengespeicherten 
Kopie in dem globalen Speicher nur gespeichert, wenn 
das ursprungliche Datenblockbyte mit einer entspre- 
chenden Position nicht bereits verandert wurde. Aus 
diesem Grund muB derselbe Prozessor daran gehindert 
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werden, eine Kopie des Blocks wiederum zwischenzu- 
speichern und dasselbe Byte wiederum zu modifizieren, 
bis die Verbindung vollstandig ist. Bevorzugterweise 
werden die Prozessoren am erneuten Zwischenspei- 
5 chern eines Datenblocks, nachdem eine Teilwort-Da- 
tenverbindung des Blocks begonnen hat, durch Ausset- 
zen jeglicher weiterer Datenabfragen fur den Block, bis 
die Verbindung vollstandig ist, gehindert. 

Urn das Aussetzen von Datenabfragen vorzusehen, 
io speichert die globale Speichersteuerung 30 eine Ausset- * 
zungs-Flag 160, siehe Fig. 4, fur jeden Datenblock 1 18 in 
dem globalen Speicher. Anfanglich ist die Aussetzungs- 
Flag 160 auf einen Nicht-Aussetzungs- Wert gesetzt, der 
in einem Ausftihrungsbeispiel der Erfindung, das eine 
15 Ein-Bit-Aussetzungs-Flag verwendet, bevorzugterwei- 
se Null ist. Wenn eine Teilwort-Datenverbindung des 
Datenblocks 118 beginnt, wird ihre zugeordnete Ausset- 
zungs-Flag 160 auf einen Aussetzungs-Wert gesetzt, be- 
vorzugterweise Eins. Wenn die Aussetzungs-Flag 160 
20 auf den Aussetzungs-Wert gesetzt ist, speichert die glo- 
bale Speichersteuerung 30 die Anfrage in einer Ausset- 
zungswarteschlange 162, wenn eine Datenabfrage emp- 
fangen wird. Die Aussetzungswarteschlange 162 ist eine 
Liste von ausgesetzten Anfragen 164—168, die in dem 
25 globalen Speicher 32 gespeichert wird. Wie es z. B. in 
Fig. 4 dargestellt ist, kann die gespeicherte, ausgesetzte 
Anfrage 164 einen Prozessoridentifizi erer 170, einen 
Abfragetypidentifizierer 172 und eine Blockadresse 174 
umfassen. Andere Formate zum Speichern ausgesetzter 
30 Anfragen 164—168 konnen ebenfalls verwendet wer- 
den. Wenn die Aussetzungs-Fiag 160 spater auf den 
Nicht-Aussetzungs- Wert zuriickgesetzt wird, nachdem 
die Teilwort-Datenverbindung vollendet ist, arbeitet die 
globale Speichersteuerung 30 die ausgesetzten Anfra- 
35 gen 164—168, die in der Warteschlange gespeichert 
sind, bevorzugterweise in einer Reihenfolge ab, bei der 
die zuerst empfangene Abfrage zuerst verarbeitet wird 
(d. h. in der empfangenen Reihenfolge). 

Um festzustellen, wann das Verbinden beendet ist, ist 
40 es notwendig, nachzuverfolgen, wieviele Kopien des 
Datenblockes 118 zwischengespeichert wurden. Bevor- 
zugterweise speichert die globale Speichersteuerung 30 
einen Zahlstand 178 fur jeden Datenblock 118 in dem 
globalen Speicher 32, um diese Zahl nachzuverfolgen. 
45 Anfanglich stellt die globale Speichersteuerung 30 jeden 
Zahlstand auf Null ein. Dann erhoht, jedesmal, wenn die 
globale Speichersteuerung 30 eine Kopie des Daten- 
blocks 118 an einen Prozessor ubermittelt, die Steue- 
rung den Zahlstand 178. Jedesmal wenn eine Kopie wie- 
50 der mit dem Block 118 verbunden wird, erniedrigt die 
globale Speichersteuerung 30 den Zahlstand 178, der 
dem Block zugeordnet ist Auch wenn eine zwischenge- 
speicherte Kopie aus dem lokalen Speicher eines Pro- 
zessors geloscht wird, ohne daB diese verandert wurde, 
55 benachrichtigt die lokale Speichersteuerung des Prozes- 
sors die globale Speichersteuerung, so daB diese den 
Zahlstand 178 erniedrigen kann. Auf diese Art wird der 
Zahlstand 178 der Anzahl der ausstehenden zwischen- 
gespeicherten Kopien eines Datenblocks genau erhal- 
60 ten. Wenn der Zahlstand 178 zuruck auf Null erniedrigt 
ist, stellt die globale Speichersteuerung 30 fest, daB das 
Verbinden beendet ist und arbeitet die ausgesetzten Da- 
tenanfragen fur diesen Datenblock ab, sofern welche 
vorhanden sind. 
65 In den Fig. 1, 3 und 4 werden in einem vierten Ausfuh- 
rungsbeispiel der Erfindung die Aussetzungs-Flag 160, 
die Aussetzungs-Warteschlange 162 und der Zahlstand 
178 ebenfalls als eine "Sperre" verwendet, die es einem 
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Prozessor errnoglicht, exklusiven Zugriff auf einen Da- 
tenblock zu erhalten. Solche Sperren sind fur synchroni- 
sierte Speicherzugriffe und fur andere Zwecke sinnvoll. 
Urn einen exklusiven Zugriff auf den Datenblock 118im 
globalen Speicher zu erhalten, ubertragt ein sperrender 
Prozessor (z. B. der Prozessor 22) eine Sperrabfrage an 
die globale Speichereinheit 26, in der der Datenblock 
118 gespeichert ist. Wenn der Zahlstand 178 fur den 
Block 118 Null ist, setzt die globale Speichersteuerung 
'30 in der globalen Speichereinheit 26 die Aussetzungs- 
Flag 116, (die ebenfalls als "Sperr"-Flag diem. Fur den 
Block auf einen gesperrtcn Wert,) kann eine Kopie des 
Datenblocks an den sperrenden Prozessor 22 zur Zwi- 
schenspeicherung iibertragen und erhdht den Zahlstand 
um Eins. Bei Ausfuhrungsbeispielen, die eine Ein-Bit- 
Aussetzungs/Sperr-Flag 160 haben, wie sie z. B. in Fig. 4 
dargestelk ist, kann der gesperrte Wert Eins sein und ein 
anfanglicher ungesperrter Wert kann NulJ sein. Das Set- 
zen der Aussetzungs/Sperr-Flag 160 verhindert.daB alle 
anderen Prozessoren eine Kopie des Datenblocks 118 
zwischenspeichern, bis der Prozessor 22 die Sperre auf- 
hebt. Daten- und Sperr-Anfragen fur den Block 118 
durch andere Prozessoren 23, 24, sind in der Ausset- 
zungswarteschlange 162-angeordnet, wahrend die Aus- 
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aufgehoben wird, und der ProzeB fortfahren kann. Spin- 
Sperren werden herkommlicherweise bei Prozessen 
verwendet, die ohne den Zugriff auf bestimmte Daten, 
die gesperrt sein konnen, nicht weiter arbeiten konnen. 
Dieses kontinuierJiche Testen eines Zustands der Sperre 
erzeugt jedoch einen erheblichen Kommunikationsver- 
kehr zwischen einem Prozessor, der den ProzeB aus- 
fuhrt, und dem globalen Speicher und halt ebenfalls die 
zentrale Verarbeitungseinheit des Prozessors an. Die 
gleiche Funktionalitat wie eine Spin-Sperre wird ohne 
den Kommunikationsverkehr und den Mehraufwand 
bei der zentralen Verarbeitungseinheit durch die Aus- 
setzung von Datenabfragen unter Verwendung der 
Aussetzungswarteschlange bei der Sperre gemaB der 
vorliegenden Erfindung geschaffen. 

Weiterhin konnen mit dieser Sperre die Prozessoren 
22—24 mit ausgesetzten Datenabfragen daran gehin- 
den werden, leerzulaufen, bis die Sperre durch die glo- 
balen Speichersteuerungcn 26, 27, die den Prozessor 
benachrichtigen, wenn sie dessen Datenabfragen aus- 
setzen, aufgehoben ist. In einigen Fallen konnen Prozes- 
se einige Ziele mit geringerer Prioritat haben, die wah- 
rend des Wartens auf die Aufhebung der gesperrten 
Daten, die fur ein Ziel mit hoherer Prioritat erforderlich 



setzungs/Sperr-Flag 160 auf den gesperrten Wert ge- 25 sind, durchgefuhrt werden. Durch Benachrichtigung des 



setzt ist. 

Wenn jedoch der Zahlstand 178 von dem Block 118 
nicht Null ist, wenn der sperrende Transistor 220 die 
Sperrabfrage ubertragt, hat bereits ein andere r Prozes- 
sor eine zwischengespeicherte Kopie des Datenblocks. 30 
Deshalb kann dem sperrenden Prozessor 22 kein exklu- 
siver Zugriff auf den Datenblock 118 gewahrt werden, 
bis alle ausstehenden zwischengespeicherten Kopien 
mit dem Datenblock verbunden wurden, wodurch der 
Zahlstand 178 auf Null zuruckgeht. Bevorzugterweise 
reagiert unter solchen Umstanden die globale Speicher- 
steuerung 30 auf die Sperrabfrage durch Setzen der 
Aussetzungs/Sperr-Flag 160 und Speichern der Sperr- 
Anfrage an erster Stelle in der AussetzungswarteschJan- 
ge 162. Dies verhindert ein wei teres Zwischenspeichern 
von Kopien des Blocks 118 und minimiert die Verzoge- 
rung beim Abarbeiten der Sperrabfrage. Sobald die aus- 
stehenden zwischengespeicherten Kopien des Blocks 
118 verbunden wurden, gent der Zahlstand 178 auf Null 
und die Sperrabfrage kann abgearbeitet werden. 

Das Aufheben der Sperre tritt auf, wenn der sperren- 
de Prozessor 22 die Sperre durch Benachrichtigen der 
globalen Speichereinheit 26 ausdrucklich aufhebt Als 
Reaktion setzt die globale Speichersteuerung 30 die 
Aussetzungs/Sperr-Flag 160 auf den ungesperrten Wert 
zuriick. 

Wahrend der Datenblock 118 gesperrt ist, werden 
jegliche Datenabfragen durch andere Prozessoren fur 
den Block ausgesetzt, d. h. in der Aussetzungswartesch 
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Prozessors von der Aussetzung seiner Datenabfrage 
kann der ProzeB, der auf dem Prozessor ablauft, andere 
sinnvolle Arbeit durchfuhren, die nicht die angeforder- 
ten Daten erfordert 

Wiederum ein weiterer Vorteil der Sperre gemaB die- 
sem Ausfiihrungsbeispiel der vorliegenden Erfindung 
besteht darin, daB, nachdem alle Funktionen der Sperre 
durch die globalen Speichereinheiten 26, 27 durchge- 
fuhrt werden, keine Veranderungen der Prozessoren 
22—24 durchgefuhrt werden miissen. 

Bei einem fiinften Ausfiihrungsbeispiel der Erfindung, 
siehe Fig. 1 und 5, werden eine globale Schreibe-Bit- 
maske 180 und eine globale Lese-Bitmaske 182 fur je- 
den Datenblock 184 in dem globalen Speicher 32 (Fig. 1 ) 
mit dem Datenblock zur Identifikation von Datenwett- 
laufzustanden gespeichert. (Nur aus Griinden der Dar- 
stellung ist die Kopie 224 hier als durch den Prozessor 
22 und der Block 196 als durch die globale Speicherein- 
heit 26 beschrieben. Es ist offensichtlich, daB andere 
Prozessoren 23—24 und globale Speichereinheiten 27 
des Corhputersystems 20 bevorzugterweise auf dieselbe 
Art und Weise arbeiten). Die globale Schreibc-Bitrnaske 
180 wird zur Nachverfolgung verwendet, welche Ele- 
ments 190— 194 des Blocks 184 wahrend dem Verbin- 
den verandert sind und besteht aus einer Mehrzahl von 
Flags 200—204, die in einer 1 : 1-Beziehung den Ele- 
menten zugeordnet sind Die globale Lese-Bitmaske 182 
wird zur Nachverfolgung verwendet, welche der Ele- 
mente 190—194 gelesen sind und besteht auf ahnlichc 



lange zur spateren Abarbeitung gespeichert. Sobald die 55 Weise aus einer Mehrzahl von Flags 210—214, die in 



Sperre aufgehoben ist, werden die Anfragen durch die 
globale Speichersteuerung in der Reihe nach abgearbei- 
tet. Durch Aussetzen von Datenanfragen arbeitet die 
Sperre auf ahnliche Weise, wie beim Zugreifen auf einen 
langsamen Speicher. Der Prozessor ubertragt eine Da- 
tenabfrage an den Speicher und die angefragten Daten 
werden zuriickgegeben, sobald diese verfiigbar sind. 

Das Aussetzen von Datenabfragen, wahrend ein Da- 
tenblock gesperrt ist, hat ebenfalls den Vorteil der Ver- 
meidung von "Spin-Sperren", die Programmierer bei an- 
deren Arten von Sperren verwenden. Spin-Sperren sind 
eine programmierte Prozedur in einem ProzeB, der kon- 
tinuierlich den Status einer Sperre testet, bis die Sperre 
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einer 1 : 1-Beziehung den Elementen zugeordnet sind. 
Die Rags 200 — 204, 210— 214 sind anfanglich auf einen 
Nicht-geschrieben- bzw. Nicht-Gelesen-Wert gesetzt 
und werden auf diese Werte zuruckgesetzt, wenn das 
Verbinden beendet ist. Bevorzugterweise ist jede Flag 
ein einzelnes Bit, wobei Null der Nicht-Geschneben- 
und Nicht-Gelesen-Wert ist. 

Bei dem fiinften Ausfiihrungsbeispiel der Erfindung 
werden ebenfalls eine lokale Schreibe-Bitmaske 220 und 
eine lokale Lese-Bitmaske 222 in dem lokalen Speicher 
44 des Prozessors zusammen mit einer Kopie 224 des 
Datenblocks 184 gespeichert, wenn die Kopie durch den 
Prozessor 22 zwischengespeichert wird. Die lokale 
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Speichersteuerung 40 verfolgt, wahrend die Kopie 224 
in dem lokalen Speicher 44 zwischengespeichert ist, mit 
der lokalen Schreibe-Bitmaske 220, ob Datenelemente 
230—234 der Kopie 224 verandert sind. Die lokale 
Schreibe-Bitmaske 220 besteht aus Flags 240 — 244, eine 
fur jedes Element 230—234 der Kopie 224. Die lokale 
Speichersteuerung 40 setzt die Flags 240 — 244 anfang- 
lich auf einen Nicht-Geschrieben-Wert, der anzeigt, daB 
die Elemente 230—234 bis jetzt nicht verandert wurden. 
' Die lokale Lese-Bitmaske 222 hat ebenfalls Flags 
250— 254, die anfanglich auf einen Nicht-Gelesen-Wert 
gesetzt sind, eine fur jedes der Elemente 230—234. Be- 
vorzugterweise ist jede Flag ein einzelnes Bit, wobei 
Null der Nicht-geschrieben- und Nicht-Gelesen-Wert 
ist. 

Wenn die zentrale Verarbeitungseinheit 36 die Ele- 
mente 230—234 der zwischengespeicherten Kopie 224 
schreibt, setzt die lokale Speichersteuerung 40 die loka- 
len Schrcibe-Bitmasken-Flags 240—244, die den ge- 
schriebenen Elementen zugeordnet sind, auf einen Ge- 
schrieben-Wert Der Geschrieben-Wert ist wiederum 
bevorzugterweise Eins fiir eine Einzelbit-Flag und der 
Nicht-Geschrieben-Wert ist Null. Wenn die Elemente 
230—234 der zwischengespeicherten Kopie 224 durch 
die zentrale Verarbeitungseinheit gelesen werden, setzt 
die lokale Speichersteuerung 40 die lokalen Lese-Bit- 
masken-Flags 250 — 254, die diesem gelesenen Element 
zugeordnet sind, auf einen Gelesen-Wert (bevorzugter- 
weise auch Eins fiir eine Einzelbit-Flag). Folglich zeigen 
die lokale Schreibe- und Lese-Bitmaske 220, 222 an, wel- 
ches Element der zwischengespeicherten Kopie 224 ge- 
schrieben bzw. gelesen wurde. 

Nachdem die zwischengespeicherte Kopie 224 aus 
dem lokalen Speicher 44 geloscht ist, ubertragt die loka- 
le Speichersteuerung 40 die lokalen Bitmasken 220, 222 
und die zwischengespeicherte Kopie 224 an die globale 
Speichereinheit 26 zum Verbinden mit dem Datenblock 
196. Die globale Speichersteuerung 30 verbindet die 
zwischengespeicherte Kopie 224 und den Datenblock 
196 unter Verwendung der lokalen Schreibe-Bitmaske 
220, wie es oben in Verbindung mit Fig. 2 beschrieben 
wurde. 

Die lokale Schreibe- und Lese-Bitmaske 220,222 wer- 
den ebenfalls in der giobalen Speichereinheit 26 ver- 
wendet, urn zu bestimmen, ob ein Datenwettlauf er- 
zeugt wurde. Wie oben beschrieben wurde, ergibt sich 
ein Schreibe/Schreibe-Datenwettlauf, wenn mehr als 
ein Prozessor dasselbe Datenelement eines Daten- 
blocks zwischen Synchronisationen schreibt Urn zu be- 
stimmen, ob ein Schreibe/Schreibe-Datenwettlauf er- 
zeugt wurde, werden die lokale Schreibe-Bitmaske 220 
und die globale Schreibe-Bitmaske 180 verglichen, um 
zu bestimmen, ob Flags an entsprechenden Stellen der 
Bitmaske beide auf den Geschrieben-Wert gesetzt sind. 
Die globale Schreibe-Bitmasken-Flags 200 — 204 zeigen 
an, welche Elemente 190—194 des Blocks 196 bereits 
durch Verbinden anderer zwischengespeicherter Ko- 
pien mit dem Block verandert wurden. Die lokalen 
Schreibe-Bitmasken- Flags 240 — 244 zeigen an, welche 
Elemente 230—234 der Kopie 224 verandert wurden. 
Wenn die Flags an entsprechenden Stellen der Schrei- 
be-Bitmasken 180, 220 folglich beide auf den Geschrie- 
ben-Wert gesetzt sind, wurde das gleiche Datenelement 
in der zwischengespeicherten Kopie, die derzeitig ver- 
bunden wird, und dem Datenblock durch eine vorherge- 
hende verbundene Kopie verandert. 

Die Bestimmung, daB Flags an entsprechenden Stel- 
len der Schreibe-Bitmasken 118, 222 beide auf den Ge- 



schrieben-Wert gesetzt sind, kann schnell durchgefuhrt 
werden, wenn die Flags Einzelbits sind, der Geschrie- 
ben-Wert Eins ist und der nicht-Geschrieben-Wert Null 
ist. Dies wird durch Durchfuhren einer bitweisen logi- 
5 schen UND-Verknupfung mit den Bitmasken 180, 220 
durchgefuhrt. Wenn irgendwelche der Bits in dem Er- 
gebnis der UND-Operation nicht Null sind, dann wurde 
sowohl in der zwischengespeicherten Kopie als auch in 
dem Datenblock ein gleiches Datenelement verandert 

io Die Stelle eines solchen nicht-Nullbits bei dem Ergebnis 
der UND-Operation zeigt weiterhin an, welche Daten- 
element oder -elemente sowohl in der zwischengespei- 
cherten Kopie als auch in dem Datenblock verandert 
wurden. Diese Information kann zum Lokalisieren von 

15 Fehlern beim ProzeBablauf auf den Prozessoren 22, die 
Schreibe/Schreibe- Datenwettlauf e verursachen, nutz- 
lich sein. 

Weiterhin treten, wie oben beschrieben wurde, Lese/ 
Schreibe-Datenwettlaufe auf, wenn ein Prozessor ein 

20 Datenelement, das durch einen anderen Prozessor ver- 
andert wurde, zwischen Synchronisationen liest Um zu 
bestimmen, ob ein Lese/Schreibe- Datenwettlauf er- 
zeugt wurde, werden die lokale Lese-Bitmaske und die 
globale Schreibe-Bitmaske 180 verglichen. Die lokale 

25 Schreibe-Bitmaske 220 und die globale Lese-Bitmaske 
182 werden verglichen. Wenn die Flags an entsprechen- 
den Stellen der lokalen Lese- und giobalen Schreibe- 
Bitmaske 222 und 180 auf den Gelesen- bzw. Geschrie- 
ben-Wert gesetzt sind, dann wurde ein gleiches Daten- 

30 element in der zwischengespeicherten Kopie 224, die 
derzeitig verbunden wird, gelesen und in dem Daten- 
block 196 durch eine vorher verbundene Kopie veran- 
dert Wenn die Flags an entsprechenden Stellen der lo- 
kalen Schreibe- und giobalen Lese-Bitmaske 220 und 

35 182 ebenfalls auf den Geschrieben- bzw. Gelesen-Wert 
gesetzt sind, dann wurde ein gleiches Datenelement in 
der zwischengespeicherten Kopie 224, die derzeitig ver- 
bunden wird, verandert und in eine vorher verbundene 
Kopie des Datenblocks 196 gelesen. Wie beim Vergleich 

40 der lokalen und giobalen Schreibe-Bitmasken 220, 180 
werden diese Bestimmungen bevorzugterweise durch 
Anwendung einer bitweisen logischen UND-Operation 
auf die Bitmasken durchgefuhrt 

Nachdem die zwischengespeicherte Kopie 224 mit 

45 dem Datenblock 196 verbunden ist, wird die Schreibe- 
Bitmaske 220 mit der giobalen Schreibe-Bitmaske 180 
verbunden. Fiir jede der Flags 240—244 der Schreibe- 
Bitmaske 220 in der gespeicherten Kopie, die auf den 
Geschrieben-Wert eingestellt sind, stellt die globale 

50 Speichersteuerung 30 die globale Schreibe-Bitmasken- 
Flags 200—204 an einer entsprechenden Stelle auf den 
Geschrieben-Wert Globale Schreibe-Bitmasken-Flags 
200—204, die bereits auf den Geschrieben-Wert gesetzt 
sind, bleiben ebenfalls auf dem Geschrieben-Wert Die 

55 Verbindung der Schreibe-Bitmasken kann durch eine 
bitweise logische ODER-Operation schnell durchge- 
fuhrt werden, bei der die Schreibe-Bitmasken-Flags 
200—204, 240—244 Einzelbitwerte sind, der Geschrie- 
ben-Wert Eins ist und der Nicht-Geschrieben-Wert Null 

so ist. Die globale Speichersteuerung fuhrt eine bitweise 
logische ODER-Operation bzgl. der Schreibe-Bitmas- 
ken 180, 220 durch und speichert die Ergebnisse in die 
globale Schreibe-Bitmaske 180. 

Die Lese-Bitmaske 222 wird ebenfalls mit der globa- 

65 len Lese-Bitmaske 182 auf eine ahnliche Art und Weise 
verbunden. Fur jede der Flags 250— 254 in der Lese-Bit- 
maske 222 der zwischengespeicherten Kopie setzt die 
globale Speichersteuerung 30 die globale Lese-Bitmas- 
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ken-Flag 210 — 214 an einer entsprechenden Stelle auf 
den Gelesen-Wert. Die globalen Lese-Bitmasken-Flags 
210-214, die bereits auf den Gelesen-Wert gesetzt sind, 
bleiben auf dem Gelesen-Wert gesetzt. Bevorzugter- 
weise hat jede Bitmaske Einzelbit- Flags, der Gelesen- < 
Wert 1st Eins und der Nicht-Gelesen-Wert ist Null, wo- 
bei die Verbindung der Bitmasken 182, 222 mittels der 
bitweisen logischen ODER-Operation ermogiicht wird. 

Wenn die zwischengespeicherte Kopie 229 und der 
Datenblock 196 wie oben in Verbindung mit Fig. 2 be- k 
schrieben wurde, verbunden wird, konnen die Flags an 
entsprechenden Stellen der logischen und globalen Bit- 
masken 220, 222, 180, 182 beide als ein Ergebnis eines 
Lesevorgangs oder einer Veranderung des zugeordne- 
ten Datenelements in zwischengespeicherten Kopien 15 
des Blocks 196, die mehrere Male erneut zwischenge- 
speichert wurden, durch einen einzelnen Prozessors auf 
den Gelesen- oder Geschrieben-Wert gesetzt sein. 
Dementsprechend identifizieren die Bitmasken sowohl 
das Lesen/Verandern der Datcnelementc 190—194 20 
durch mehrere Prozessoren, was einen Datenwettlauf 
erzeugt, und durch einen einzelnen Prozessor bei erneut 
zwischengespeicherten Kopien, was keinen Datenwett- 
lauf erzeugt. Alternativ konnen die Prozessoren 22—24 
daran gehindert werden, weitere Kopien des Daten- 
blocks 196 nach dem Beginn der Verbindung unter Ver- 
wendung der Aussetzungs-Flag 160 (Fig. 4) und der 
oben beschriebenen Aussetzungswarteschlange 162 
zwischenzuspeichem, so daB die Bitmasken lediglich 
tatsachliche Datenwettlaufe identifizieren. Diese Alter- 
native vermeidet das Verandern oder Lesen und Veran- 
dern eines Datenelements durch einen einzelnen Pro- 
zessor bei mehreren, erneut zwischengespeicherten Ko- 
pien des Datenblocks 196 durch Aussetzen weiterer An- 
fragen nach dem Datenblock, nachdem das Verbinden 
beginnt. Das Aussetzen der Anfrage erzeugt jedoch ei- 
ne willkiirliche Verzogerung bei diesen Prozessoren, bis 
alle ausstehenden Kopien des Blocks verbunden sind. 

Bei einem sechsten Ausftihrungsbeispiel der Erfin- 
dung (siehe Fig. 1) wird der Kommunikationsverkehr 
zwischen den Prozessoren 22—24 und den globalen 
Speichereinheiten 26, 27 durch Durchfuhren bestimmter 
"Datenreduktions"-Operation in den globalen Speicher- 
einheiten verringert (solche Operationen werden hier 
( :■■ als globale Reduktions-Operationen bezeichnet). Glo- 
bale Reduktions-Operationen konnen verschiedene 
Formen annehmen und konnen sowohl auf Datenwerte 
als auch Sperrwerte angewendet werden. Bei vielen 
Prozessen, die in dem Multiprozessor-Computersystem 
20 ausgefiihrt werden, ist es wunschenswert, eine erste 
Form der globalen Reduktions-Operation bzgl. eines 
Datensatzes durchzufuhren, die zu einem einzelnen 
Wert fuhrt, der dann an einer bestimmten Stelle in ei- 
nem Datenblock gespeichert ist. Ein ProzeB kann z. B. 
vorsehen, den Maximal- oder Minimal-Wcrt eines Ar- 
rays von Werten in einem Element eines Datenblocks zu 
speichern. Andere herkommliche globale Reduktions- 
Operationen dieser Art schlieBen Speichern der Sumrne 
oder des Produkts eines Satzes von Datenelementen 
oder Speichern des Ergebnisses einer UND- oder 
ODER-Operation ein, die auf alle Elemente in einem 
Satz an einer bestimmten Stelle eines Datenblocks 
durchgefuhrt wird. 

GemaS dem sechsten Ausfiihrungsbeispiel der Erfin- 
dung werden bestirnmte Datenreduktions-Operationen 
durch die globalen Speichersteuerungen 30, 31 als Reak- 
tion auf Datenreduktionsabfragen durch die Prozesso- 
ren 22—24 durchgefuhrt. Um z. B. eine Datenreduk- 
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tions-Operation durchzufuhren, die den Maximal-Wert 
eines Satzes von Datenelementen in dem globalen Spei- 
cher 32 an einer bestimmten Stelle speichert, ubermit- 
telt der Prozessor 22 eine Anfrage an die globale Spei- 
chcrsteuerung 30, in der er die "reduziere auf Maxi- 
mum"-Operation, den Objektsatz an Datenelementen 
und den Ort, an dem das Ergebnis gespeichert werden 
soli, bestimmt. (Der bestirnmte Satz von Datenelemen- 
ten kann irgendwo in dem globalen Speicher 32 gespei- 
chert werden). Als Reaktion fiihrt die Steuerung 30 die 
angeforderte Operation aus. Die Steuerung 30 erfaBt 
den Maximal-Wert des bestimmten Satzes und spei- 
chert diesen Wert an der bestimmten Stelle. 

Bei einer zweiten Form einer globalen Reduktions- 
Operation stellt ein Prozessor (z. B. der Prozessor 22), 
der die globale Reduktions-Operation anfordert, einen 
Operanden bereit und bestimmt eine globale Speicher- 
stelle eines zweiten Operanden. Der abfragende Prozes- 
sor 22 bestimmt ebenfalls die beziiglich dieser Operan- 
den auszufiihrende Operation. Die Operation selbst 
wird wiederum durch die globale Speichersteuerung 30 
fur die bestirnmte Speicherstelle durchgefuhrt. Die glo- 
bale Speichersteuerung 30 fuhrt die Operation beziig- 
lich der Operanden aus und speichert das Ergebnis in 
25 dem globalen Speicher 32, entweder anstelle des zwei- 
ten Operanden oder an einer anderen Stelle, die durch 
den Prozessor 22 bestimmt ist. 

Das Durchfuhren von Datenreduktions-Operationen 
in den globalen Speichereinheiten 26, 27 reduziert den 
30 Kommunikationsverkehr zwischen den Prozessoren 
22—24 und den globalen Speichereinheiten. Wenn Da- 
tenreduktions-Operationen durch die Prozessoren 
22 — 24 selbst durchgefuhrt werden, miissen erhebliche 
Daten ausgetauscht werden. Die Prozessoren, die die 
35 Datenreduktions-Operation durchfuhren, miissen zu- 
erst Datenabfragen an die globale Speichereinheit fur 
den Objektsatz von Datenelementen ubertragen. Als 
Reaktion iibertragt die globale Speichereinheit Kopien 
des Datenblocks oder der Blocke, die den Objektsatz 
40 enthalten an den anfordernden Prozessor zur Zwischen- 
speicherung. Der Prozessor fiihrt die Datenreduktions- 
Operation beziiglich der zwischengespeicherten Ko- 
^ pien aus und schreibt das Ergebnis an die Zielstelle (die 
wiederum in einem anderen Datenblock sein kann und 
45 die Zwischenspeicherung eines solchen anderen Block 
erfordert). Der Prozessor iibertragt dann die nun veran- 
derte Kopie, die die Zielstelle enthalt und die zugeord- 
nete Schreibe-Bitmaske zuriick an die globale Speicher- 
einheit zum Verbinden mit dem Datenblock. Weiterhin 
50 erfordert jeder dieser verschiedenen Datenblockzugrif- 
fe im allgemeinen das Zugreifen auf eine Sperre, die 
diesem Datenblock zugeordnet ist (was das Warten auf 
die Beendigung eines Verbindungsprozesses notwendig 
machen kann), und hebt hinterher die Sperre auf. 
55 Wenn die Datenreduktions-Operationen in den glo- 
balen Speichereinheiten 26, 27 durchgefuhrt werden, 
werden im Gegensatz dazu lediglich eine Datenreduk- 
tion und ein Datenwert zur Verwendung bei der Daten- 
reduktionsabfrage (und in einigen Fallen ein Datenwert 
60 eines Operanden) von einem abfragenden Prozessor an 
eine globale Speichereinheit die die Operation durch- 
fuhrt, ubertragen. Auch der Mehraufwand, der dem Pro- 
zessor zugeordnet ist, der auf die Sperren der verschie- 
denen Datenblocke zugreift, wird vermieden. 
65 In Fig. 1 kann eine groBe Anzahl von Prozessoren 
22—24 in dem Computersystem 20 zeitweise Zugriff auf 
einen einzelnen Datenblock erfordem, der in einer der 
globalen Speichereinheiten 26, 27 gespeichert ist. (Es ist 
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offensichtlich, daB die drei Prozessoren 22—24 und zwei 
globalen Speichereinheiten 26—27, die in Fig. 1 gezeigt 
sind t aus darstellerischen Griinden vorgesehen sind, und 
daB eine groBere Anzahl von Prozessoren und globalen 
Speichereinheiten in dem Computersystem 20 einge- 
schlossen sein kann). In solchen Situationen muB die 
globale Speichereinheit, die den Datenblock speichert, 
eine groBe Anzahl von Datenabfragen abarbeiten und 
spater die zwischengespeicherten Kopien des Blocks 
verbinden. Dementsprechend kann die Rate, bei der die 
globale Speichereinheit diese Abarbeitungs- und Ver- 
bindungs-Operationen durchfuhren kann, uberschritten 
werden. Als ein Ergebnis werden einige der Abarbei- 
tungs- und Verbindungs-Operationen verzogert, was ei- 
nen sog. "Flaschenhals" erzeugt. Zu dieser Zeit konnen 
andere globale Speichereinheiten leerlaufen. 

Bei dem siebten Ausfuhrungsbeispiel der Erfindung 
wird dieser mogliche Flaschenhals, der aus einer groBen 
Anzahl von Prozessoren resultiert, die auf einen einzel- 
nen Datenblock zugreifen, der in einem Prozessor ge- 
speichert ist, durch eine hierarchische gemeinsame Ver- 
wendung und Verbindung solcher Datenblocke unter 
getrennten globalen Speichereinheiten vermieden. 
Wenn die globale Speichereinheit 26 z. B. beginnt, eine 
groBe Anzahl von Datenblockabfragen fur den gieichen 
Datenblock zu empfangen (wenn z. B. die Anzahl von 
Datenblockabfragen eine vorbestimmte Grenze uber- 
schreitet), iibertragt die globale Speichereinheit 26 eine 
Kopie des Datenblocks (im folgenden "ursprunglicher 
Datenblock" genannt) an eine weitere globale Speicher- 
einheit Beim Empfang der Kopie in der globalen Spei- 
chereinheit 27 speichert die globale Speichersteuerung 
31 die Kopie (im folgenden "globale Kopie" genannt) in 
dem globalen Speicher 33. In Fig. 1 und 6 wird die Abar- 
beitung von weiteren Datenblockabfragen fur den 
Block und die Verbindung von zwischengespeicherten 
Kopien des Blocks dann zwischen die globalen Spei- 
chereinheiten 26, 27 aufgeteilt Bevorzugterweise wird 
die Aufteilung gemaB einer vorbestimmten hierarchi- 
schen Reihenfolge der Prozessoren und globalen Spei- 
chereinheiten durchgefuhrt Eine solche hierarchische 
Reihenfolge 270 der Prozessoren 22—24 und globalen 
Speichereinheiten 26—27 ist in Fig. 6 gezeigt. Es ist of- 
fensichtlich, daB die hierarchische Reihenfolge eine logi- 
sche Reihenfolge oder Zuordnung der Prozessoren zu 
den globalen Speichereinheiten ist, und keine Anderung 
der Struktur des Computersystems, die in Fig. 1 darge- 
stellt ist, darstellt. Es ist ebenfalls offensichtlich, daB die 
hierarchischen Reihenfolgen gemaB diesem Ausfuh- 
rungsbeispiel der Erfindung viel mehr Prozessoren, glo- 
bale Speichereinheiten und hierarchische Stufen ein- 
schlieBen konnen, als in Fig. 6 dargestellt ist Insbeson- 
dere kann das Computersystem 20 zusatzliche globale 
Speichereinheiten einschlieBen, und globale Kopien der 
ursprunglichen Datenblocke konnen in mehr als einem 
dieser globalen Speichereinheiten gespeichert sein. 
Auch werden viele Prozessoren typischerweise jedem 
der globalen Speichereinheiten, die eine globale Kopie 
des urspriinglichen Datenblocks speichern, zugeordnet 
sein. 

Bei der bevorzugten hierarchischen Reihenfolge 270 
sind einige der Prozessoren der globalen Speicherein- 
heit 26 und andere der globalen Speichereinheit 27 zu- 
geordnet Solche Datenblockabfragen, die durch den 
Prozessor 22, der der globalen Speichereinheit 26 zuge- 
ordnet ist, ubermittelt werden, werden durch diese Ein- 
heit abgearbeitet Die Verbindung von Kopien des 
Blocks, der durch den Prozessor 22, der der Einheit 26 
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zugeordnet ist zwischengespeichert ist, werden mit dem 
ursprunglichen Datenblock, wie es in Verbindung mit 
Fig. 2 beschrieben wurde, verbunden. Die Abarbeitung 
von Datenblockabfragen und die Verbindung von zwi- 
5 schengespeicherten Kopien fur diese Prozessoren 22, 
24, die der Einheit 27 zugeordnet sind, wird jedoch 
durch die Einheit 27 durchgefuhrt In der globalen Spei- 
chereinheit 27 werden Kopien, die in den Prozessoren 
23 und 24 zwischengespeichert sind, mit der globalen 
10 Kopie, die in dem globalen Speicher 33 gespeichert ist, 
verbunden. Auf ahnliche Weise wie das Verbinden, das 
oben in Verbindung mit Fig. 2 beschrieben wurde, wird 
jede zwischengespeicherte Kopie mit der globalen Ko- 
pie durch Speichern derjenigen Elemente der zwischen- 
15 gespeicherten Kopie, deren zugeordnete Flags in einer 
lokalen Schreibe-Bitmaske auf den Geschrieben-Wert 
gesetzt sind, in die globale Kopie verbunden. Eine glo- 
bale Schreibe-Bitrnaske wird in der Einheit 27 auch ge- 
speichert, so daB die globale Kopie spater mit dem ur- 
20 sprunglichen Datenblock, der in der Einheit 26 gespei- 
chert ist, verbunden werden kann. Diese globale Schrei- 
be-Bitrnaske hat Flags, die in einer 1 : 1-Beziehung den 
Elementen der globalen Kopie zugeordnet sind. Diese 
Flags sind anfanglich auf den Nichtgeschrieben-Wert 
25 gesetzt Wenn die Elemente der globalen Kopie wah- 
rend der Verbindung einer zwischengespeicherten Ko- 
pie verandert werden, werden die globalen Schreibe- 
Bitmasken-Flags, die solchen Elementen einer Flag zu- 
geordnet sind, auf den Geschrieben-Wert gesetzt 
30 Sobald alle zwischengespeicherten Kopien der Pro- 
zessoren, die der Einheit 27 zugeordnet sind, mit der 
globalen Kopie verbunden sind, wird die globale Kopie 
mit dem urspriinglichen Datenblock verbunden. Um die 
globale Kopie und den ursprunglichen Datenblock zu 
35 verbinden, werden solche Elemente der globalen Kopie, 
deren zugeordnete globale Schreibe-Bitmasken-Flags 
auf den Geschrieben-Wert gesetzt sind, an entsprechen- 
den Stellen des ursprunglichen Datenblocks gespei- 
chert. 

40 Bei einem achten Ausfuhrungsbeispiel der Erfindung, 
das in Fig. 7 dargestellt ist wird die Notwendigkeit, An- 
forderungen durch die Prozessoren 22—24 (Fig. 1) nach 
einem Datenblock 280, der in dem globalen Speicher 32 
( Fi g- 1) gespeichert ist, auszusetzen, sobald die Verbin- 
45 dung beginnt, durch ein alternatives Verbindungssche- 
ma vermieden, daB eine spezielle Verbindungs-Flag 282 
und eine spezielle Verbindungstabelle 284, die dem Da- 
tenblock 280 zugeordnet ist, verwendet Im Gegensatz 
zu dem ersten Ausfuhrungsbeispiel der Erfindung, das 
50 oben beschrieben wurde, wird die Notwendigkeit, An- 
forderungen fur teilweise verbundene Datenblocke aus- 
zusetzen, mit einem Verbindungsschema, das lokale 
Schreibe-Bitmasken 56 (Fig. 2), die den zwischengespei- 
cherten Kopien des Blocks zugeordnet sind, vermieden. 
55 Das Verbindungsschema des achten Ausftihrungsbei- 
spiels hat zwei Verbindungsmodi, einen "normalen" Mo- 
dus und einen "speziellen" Modus, der durch den Zu- 
stand der speziellen Verbindungsflag 282 gesteuert ist 
Die spezielle Verbindungsflag 282 hat zwei Zustande, 
60 einen ersten Zustand, der den normalen Verbindungs- 
modus anzeigt, und einen zweiten Zustand, der den spe- 
ziellen Verbindungsmodus anzeigt Anfanglich ist die 
spezielle Verbindungsflag 282 auf den ersten Zustand 
gesetzt und der normale Verbindungsmodus wird ver- 
65 wendet Nachdem die Verbindung beginnt, und eine An- 
forderung durchgefuhrt wird, um eine Kopie des nun 
teilweise verbundenen Datenblocks 280 zwischenzu- 
speichern, wird der spezielle Verbindungsmodus ver- 
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wendet, und die spezielle Verbindungsflag 282 wird auf 
den zweiten Zustand gesetzt 

Bei dem anfanglichen, normalen Verbindungsmodus 
konnen Kopien des Datenblocks 280 durch die Prozes- 
soren 22—24 angefordert und in ihren lokalen Spei- 
chern 44—46 (Fig. 1) gespeicheri oder zwischengespei- 
chert werden. Wenn die zwischengespeicherten Kopien 
aus den lokaien Speichern 44— 46 geloscht sind, werden 
sie mit dem Datenblock 280 in der globalen Speicherein- 
' heit 26 (Fig. 1) mit der Hilfe einer globalen Schreibe-Bit- 
maske 288, die dem Datenblock zugeordnet ist, verbun- 
den. Die globale Schreibe-Bitrnaske 288 enthalt Bitmas- 
ken-Flags 290—293, um anzuzeigen, ob Datenelemente 
296 — 299 des Datenblocks 280 seit der letzten vollstan- 
digen Verbindung verandert wurden. Anfanglich sind 
die Bitmasken-Flags 290—293 alle auf einen Nicht- Ver- 
andert- Wert gesetzt. Jede zwischengespeicherte Kopie 
wird durch Speichern dieser Datenelemente der zwi- 
schengespeicherten Kopie, die sich von entsprechend 
angeordneten, unveranderten Datenelementen 
296—299 des Datenblocks unterscheidet, verbunden. 
Die Bitmasken-Flags 290—293 fur die Datenblockele- 
( : mente 296 —299, die so verandert wurden, werden auf 
einen Verandert-Wert gesetzt. 

Ein Zahler 304 verfolgt die Anzahl von zwischenge- 
speicherten Kopien des Datenblocks 280, die noch aus- 
stehen. Der Zahler 304 wird fur jede Kopie des Daten- 
blocks 280, die durch die Prozessoren 22 — 24 zwischen- 
gespeichert werden, erhoht und fur jede zwischenge- 
speicherte Kopie des Datenblocks 280, die aus den loka- 
len Speichern 40 —46 geloscht wird, erniedrigt. Die Ver- 
bindung ist vollstandig, wenn der Zahler 304 auf Null 
zuruckkehrt. Daraufhin werden alle globalen Schreibe- 
Bitmasken- Flags 290 — 293 auf den Nicht- Verandert- 
Wert zuruckgesetzt. 

Nachdem die Verbindung in dem normalen Verbin- 
dungsmodus beginnt (d. h. zumindest eine zwischenge- 
speicherte Kopie wurde mit dem Datenblock 280 ver- 
bunden, wobei zumindest eines der Datenelemente 
296—299 verandert wird), verursacht jegliche nachfol- 
gende Anfrage nach einer Kopie des Datenblocks 280 
durch die Prozessoren 22 — 24 den Eintritt in den spe- 
ziellen Verbindungsmodus. (Bei dem bekannten Karp- 
Sarkar-Verbindungsschema wurden solche nachfolgen- 
; : . den Anforderungen ausgesetzt). Um festzustellen, ob 
die Verbindung begonnen hai, kann die globale Schrei- 
be-Bitrnaske 280 getestet werden. Wenn irgendeine der 
Bitmasken-Flags 290—293 auf den Geandert-Wert ge- 
setzt ist, hat die Verbindung begonnen. Wenn die globa- 
le Speichersteuerung 30 (Fig. 1) eine Anfrage nach einer 
Kopie des Datenblocks 280 empfangt und die globale 
Schreibe-Bitrnaske ist nicht Null (wobei der Verandert- 
Wert der Bitmasken-Flags 1 Bit ist), setzt die Steuerung 
30 dementsprechend die spezielle Verbindungsflag auf 
den zweiten Zustand, um in den speziellen Verbindungs- 
modus einzutreten. 

In dem speziellen Verbindungsmodus reagiert die 
globale Speichersteuerung 30 auf eine Anfrage nach 
einer Kopie des Datenblockes 280 (einschl. der Anfrage, 
die den Eintritt in den speziellen Verbindungsmodus 
verursacht hat) durch einen der Prozessoren 22—24 
durch Obertragen der Kopie an den abfragenden Pro- 
zessor. (Solche Kopien, die wahrend des speziellen Ver- 
bindungsmodus erhalten werden, sind "teilweise ver- 
bundene" Kopien, da sie erhalten wurden nachdem die 
Verbindung des Datenblocks 280 begonnen hat). Die 
globale Speichersteuerung 30 verfolgt diese teilweise 
verbundenen Kopien unter Verwendung der speziellen 
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Verbindungstabelle 284. Die globale Speichersteuerung 
speichert ein Duplikat der teilweise verbundenen Kopie 
308 (identisch zu derjenigen, die an den abfragenden 
Prozessor gesendet wurde) in einem unbesetzten Schlitz 
5 309 der speziellen Verbindungstabelle 2S4 zusammen 
mit einem Prozessoridentifizierer 310 (um den abfra- 
genden Prozessor zu identifizieren) und einer Block- 
adresse 312 (um den Datenblock 280 zu identifizieren, 
von dem die Duplikatkopie herstammt). Die Duplikat- 
io kopie 308, der Prozessoridentifizierer 310 und die 
Blockadresse 312 bilden einen "Eintrag" in die spezielle 
Verbindungstabelle. Die Blockadresse 212 ermoglicht 
es, die spezielle Verbindungstabelle 284 fur mehr als 
einen Datenblock in dem globalen Speicher zu verwen- 
15 den. Alternativ konnen spezielle Verbindungstabellen 
(einer fur jeden Datenblock) nach Bedarf aus einem 
unbenutzten Abschnht des globalen Speichers 32 
(Fig. 1) zugeordnet werden. Mit solchen aiternativen 
speziellen Verbindungstabellen muB die Blockadresse 
20 312 nicht gespeichert werden. 

Beim Verbinden einer zwischengespeicherten Kopie 
mit Datenblock 280 im speziellen Verbindungsmodus 
sucht die globale Speichersteuerung die spezielle Ver- 
bindungstabelle 284 nach einem Eintrag ab, der den Pro- 
25 zessoridentifizierer 310 des Prozessors, der die Kopie 
zwischengespeichert hat, enthalt, und die Blockadresse 
312 fur den Datenblock 280, von woher die zwischenge- 
speicherte Kopie herstammt, um festzustellen, ob die 
zwischengespeicherte Kopie eine teilweise verbundene 
30 Kopie ist. Wenn die Tabelle keinen solchen Eintrag ent- 
halt (was anzeigt, daB die zwischengespeicherte Kopie 
keine teilweise verbundene Kopie ist), werden die zwi- 
schengespeicherte Kopie und der Datenblock 280 wie 
im normalen Verbindungsmodus unter Verwendung der 
35 globalen Bitmaske 288 verbunden. Wenn jedoch ein sol- 
cher ubereinstimrnender Eintrag (z. B. Eintrag 309) exi- 
stiert (wodurch angezeigt ist, daB die zwischengespei- 
cherte Kopie eine teilweise verbundene Kopie ist), wird 
die zwischengespeicherte Kopie unter Verwendung ei- 
40 ner Aktualisierungs-Bitmaske 316 verbunden. 

Beim Verbinden einer teilweise verbundenen Kopie 
erzeugt die globale Speichersteuerung 30 die Aktuali- 
sierungs-Bitmaske 316, die Bitmasken-Flags 320—323 
enthalt, die den Datenelementen der teilweise verbun- 
45 denen Kopie (nicht gezeigt) zugeordnet sind. Die Steue- 
rung setzt diese Bitmasken-Flags 320—323 auf den Ge- 
andert-Wert, die Datenelementen der teilweise verbun- 
~ denen Kopie zugeordnet sind, die sich von entsprechend 
angeordneten Datenelementen der Duplikatkopie 308 
so bei dem ubereinstimmenden Eintrag 309 unterscheiden. 
Diese Aktualisierungs-Bitmaske 316 steuert die Verbin- 
dung. Die Steuerung 30 speichert solche Datenelemente 
der teilweise verbundenen Kopie, deren zugeordnete 
Bitmasken-Flags 320— 323 auf den Geandert-Wert ge- 
55 setzt sind, in dem globalen Datenblock 280. Der iiber- 
einstimrhende Eintrag 309 in der Warteschlange wird 
dann geloscht. 

Nach dem Verbinden der teilweise verbundenen Ko- 
pie in den globalen Datenblock 380, verbindet die globa- 
60 le Speichersteuerung 30 ebenfalls die Aktualisierungs- 
Bitmaske 316 mit der globalen Bitmaske 288. Fur jede 
der Bitmasken-Flags 320 — 323 der Aktualisierungs-Bit- 
maske 360, die auf den Geandert-Wert gesetzt ist, setzt 
die Steuerung 30 die entsprechend angeordneten Bit- 
es masken-Flags 290—293 der globalen Bitmaske 288 auf 
den Geandert-Wert Wenn der Geander-Wert ein ein- 
zelner Ein-Bit und der Nicht-geandert-Wert ein einzel- 
ner Null-Bit ist, kann die Verbindung durch Speichern 
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des Ergebnisses einer bitweisen iogischen ODER-Ver- 
kniipfung der giobalen und der Aktualisierungs-Bitmas- 
ke 288, 316 in der giobalen Bitmaske 288 bewirkt wer- 
den. 

Das gerade beschriebene, alternative Verbindungs- 5 
schema des achten Ausfiihrungsbeispiels der Erfindung 
kann ebenfalls auf das Teilwort-Verbindungs-Schema 
des dritten Ausfuhrungsbeispiels, das oben beschrieben 
wurde, angewendet werden, urn die Notwendigkeit zur 
• Aussetzung von Prozessorabfragen auszuschlieBen, die 10 
nach dem Beginn der Teilwort-Verbindung auftreten. 
Bei einem solchen Ausfuhrungsbeispiel der Erfindung, 
bei der ein Teilwort-Speicher-Teilungs-Schema das al- 
ternative Verbindungsschema ersetzt, werden Anfra- 
gen, die nach dem Verbinden einer zwischengespeicher- 15 
ten Kopie, die durch eine Teilwort-Speicher-Operation 
verandert wurde, mil einem Datenblock im giobalen 
Speicher, nicht ausgesetzt. Statt dessen sendet die glo- 
bale Speichersteuerung30 (Fig. 1) die angeforderte Ko- 
pie des teilweise verbundenen Datenblocks an den ab- 20 
fragenden Prozessor, macht einen entsprechenden Ein- 
trag in die spezielle Verbindungstabelle, und setzt eine 
spezielle Verbindungsflag. Danach werden verbundene 
Kopien, die iibereinstimmende Tabelleneintrage haben, 
mit einer Aktualisierungs-Bitmaske verbunden, und 25 
zwischengespeicherte Kopien ohne iibereinstimmende 
Eintrage werden mit einer giobalen Bitmaske wie beim 
achten Ausfuhrungsbeispiel verbunden. Bevor die spe- 
zielle Verbindungsflag gesetzt wird, werden zwischen- 
gespeicherte Kopien wie beim dritten Ausfuhrungsbei- 30 
spiel verbunden. 

In den Fig. 1 und 3 schafft ein neuntes Ausfuhrungs- 
beispiel der Erfindung eine Datenverbindung in den gio- 
balen Speichereinheiten 26, 27 (Fig. 1) auf der Bit-Ebe- 
ne. Mit dieser Fahigkeit kann mehr als einer der Prozes- 35 
soren 22—24 (Fig. 1) Bits in demselben Byte eines ge- 
meinsamen Datenblocks verandern, solange nicht zwei 
Prozessoren den gleichen Bit zwischen Synchronisatio- 
nen verandern. Die getrennt veranderten Bits in der 
zwischengespeicherten Kopie jedes Prozessors werden 40 
spater auf der Bit-Ebene zu dem ursprunglichen Daten- 
block im giobalen Speicher verbunden. Jegliche Daten- 
wettlaufe, die durch gemeinsame Verwendung der Da- 
ten zwischen mehreren Prozessoren erzeugt werden, 
konnen auf der Bit-Ebene erfaBt werden. 45 

Bei dem neunten Ausfuhrungsbeispiel der Erfindung 
(wie bei dem dritten Ausfuhrungsbeispiel, siehe Fig. 3) 
ist eine Teilwort-Speicher-Flag 110 und eine Schreibe- 
Bitmaske 88 der zwischengespeicherten Kopie jeder 
zwischengespeicherten Kopie 86, die in den lokalen 50 
Speichern 44 —46 der Prozessoren gespeichert ist, zuge- 
ordnet Die Teilwort-Speicher-Flag 110 umfaBt in dem 
neunten Ausfuhrungsbeispiel bevorzugterweise einen 
Zwei-Bit-Wert zum Anzeigen der Datenelemente mit 
minimaler GroBe, die in der zwischengespeicherten Ko- 55 
pie 86 verandert wurden. Mit einem Zwei-Bit-Wert kon- 
nen vier minimale GrdBen angezeigt werden. Ein Wert 
von "11" kann z. B. verwendet werden, um anzuzeigen, 
daB einzelne Bit der zwischengespeicherten Kopie ver- 
andert wurden. Werte von "10", "01", und "00" konnen 6 o 
verwendet werden, um anzuzeigen, daB Bytes, Halb- 
worter (im allgemeinen 16 Bit-Datenelemente) bzw. 
Worter die veranderten Datenelemente mit der mini- 
malen GrGBe wahren. 

Wenn bei dem neunten Ausfuhrungsbeispiel ein 65 
Wort, Halbwort oder Byte die minimale GroBe eines 
veranderten Datenelements ist, wird die zwischenge- 
speicherte Kopie 86 mit ihrem ursprunglichen Daten- 
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block auf dieselbe Art wie beim dritten Ausfuhrungsbei- 
spiel verbunden. lnsbesondere wenn ein Wort das klein- 
ste veranderte Datenwort ist, wird die zwischengespei- 
cherte Kopie unter Verwendung der Schreibe-Bitmaske 
88 der zwischengespeicherten Kopie verbunden. Wenn 
die minimale GroBe des veranderten Datenelements ein 
Halbwort oder ein Byte ist, wird die zwischengespei- 
cherte Kopie unter Verwendung einer Teilwort- 
Schreib-Bitmaske 124 (Fig. 4) verbunden, die eine Bit- 
masken-Flag fur jedes Halbwort bzw. Byte des ur- 
sprunglichen Datenblocks 118 (Fig. 4) hat. Zwischenge- 
speicherte Kopien, die auf der Bit-Ebene verandert sind, 
werden wie unten beschrieben wird, verbunden. Sobald 
der ursprungliche Datenblock 118 auf der Halbwort-, 
Byte- oder Bit-Ebene verbunden ist, werden jegliche 
zuruckbleibenden zwischengespeicherten Kopien des 
Datenblocks ebenfalls auf der gleichen Ebene verbun- 
den, bis eine Verbindung auf niedrigerer Stufe notwen- 
dig ist oder die Verbindung abgeschlossen ist. 

Fur die meisten zwischengespeicherten Kopien ist 
das veranderte Element mit der geringsten GroBe im 
allgemeinen das Wort Der VerbindungsprozeB fur sol- 
che zwischengespeicherte Kopien ist der schnellste, er- 
fordert am wenigstens Verarbeitungsaufwand und eine 
kleinere Bitmaske. Zwischengespeicherte Kopien, deren 
veranderte Elemente mit minimaler GroBe Bytes oder 
Halbworter sind, treten weniger haufig auf. Die Verbin- 
dung benotigt dann einen groBeren Verarbeitungsauf- 
wand und mehr Zeit. Die Verbindung von zwischenge- 
speicherten Kopien, die auf der Bit-Ebene verandert 
wurden, ist sogar noch weniger haufig und es wird noch 
mehr Verarbeitungszeit und -aufwand verbraucht. Folg- 
lich besteht der Vorteil der Verbindung auf der Ebene 
des veranderten Datenelements mit geringster GroBe 
darin, daB die Verarbeitungszeit und -aufwand fur eine 
gegebene zwischengespeicherte Kopie minimiert wer- 
den, wahrend die gemeinsame Datenverwendung zwi- 
schen Prozessoren bis zur Bit-Ebene hinunter moglich 
wird, wenn dies notwendig ist. 

Zum Verbinden auf der Bit-Ebene ist es notwendig, zu 
erfassen, wann Bit-Ebenen-Veranderungen der zwi- 
schengespeicherten Kopie 86 durchgefiihrt werden (sie- 
he Fig. 1,3 und 8). 

Mit herkommlichen CPUs 36—38 verandern im allge- 
meinen lediglich Speicher-Operationen (in Wort- oder 
Bit-GroBeninkrementen), die durch die CPUs ausge- 
fuhrt werden, direkt die Daten in zwischengespeicher- 
ten Kopien, die in lokalen Speichern 44—46 gespeichert 
sind. Veranderungen eines Worts oder eines Bytes in 
solchen zwischengespeicherten Kopien konnen deshalb 
erfaBt werden, wenn eine CPU 36—38 eine Speicher- 
Operation durchfuhrt, um das Wort, Halbwort oder By- 
te von seinem inneren Register an die Lokalspeicher 
44—46 zu bewegen. Nachdem lediglich Lade- und Spei- 
cher-Operationen Daten zwischen den CPUs 36—38 
und lokalen Speichern 44—46 bewegen, werden einzel- 
ne Bits an einer zwischengespeicherten Kopie indirekt 
verandert. Um einzelne Bits zu verandern, laden die 
CPUs 36—38 ein inneres Register mit einem Byte oder 
Wort an Daten, ftihren eine oder mehrere Bit-Ebenen- 
Operationen bezuglich der Daten durch, speichern dann 
das Wort oder Byte in der zwischengespeicherten Ko- 
pie in den lokalen Speichern 44—46. 

Um Bit-Ebenen-Veranderungen zu erfassen, haben 
die CPUs 36—38 beim neunten Ausfuhrungsbeispiel ei- 
ne Bit- Verandert- Flag fur jedes ihrer inneren Register. 
Wie es z. B. in Fig. 8 dargestelh ist, kann die CPU 36 acht 
innere Register 330—337 zur vorubergehenden Spei- 
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cherung von Daten, die durch die funktionale Einheit 
338 der CPU verarbeitet wird, umfassen. Im allgemei- 
nen enthalt die Funktionseinheit 338 Ganzzahl- und 
Gleit-Komrna-Verarbeitungsschaltungen und -eine Be- 
fehlsdekodierungsschaltung. Die CPU 36 hat fur jedes 5 
innere Register 330 — 337 ebenfalls Bit-Verandert-Flags 
340—347 mit einem Bit. Die CPU 36 iibertragt Daten 
zwischen den inneren Registern 330—337 und dem lo- 
kalen Speicher 344 (Fig. 1) iiber einen Prozessor-Bus 
' 350 und eine Bus-Schnittstelle 352. 10 
Die Bit-Verandert-Flags 340—347 zeigen an, ob Da- 
ten in ihren zugeordneten Registern 330—337 auf der 
Bit-Ebene verandert wurden. Wenn die CPU Daten in 
irgendeines der inneren Register 330—337 ladt, ist die 
Bit-Verandert-Flag 340—347 fur das Register anfang- 15 
lich auf einen Unverandert-Wert (z. B. Null) gesetzt. 
Wenn die CPU 36 innerhalb ihrer Funktionseinheit 338 
einen BefehJ ausfiihrt, der eines oder mehrere Bits der 
Daten in einem Register verandert, aber nicht ein ge- 
samtes Byte oder Wort, setzt die Funktionseinheit 338 20 
die Bit-Verandert-Flag auf einen Verandert-Wert (z. B. 
Eins). Wenn die CPU 36 die Daten aus einem der inne- 
: ren Register 330—337 in der zwischengespeicherten 
Kopie 86 in dem iokalen Speicher 44 speichert, iiber- 
priift die lokaie Speichersteuerung 40 die Bit-Veran- 25 
dert-Flag, die diesem Register zugeordnet ist, um zu 
bestirnmen, ob die zwischengespeicherte Kopie auf der 
Bit-Ebene verbunden werden sollte, und setzt dement- 
sprechend die Teilwort- Verandert-Flag 1 10 fur die zwi- 
schengespeicherte Kopie. 30 

Bei dem neunten Ausfuhrungsbeispiel (vgl Fig. 4) 
wird die zwischengespeicherte Kopie 86 mit ihrem ur- 
spriinglichen Datenblock 118 auf der Bit-Ebene verbun- 
den, wenn die TeiJwort-Speicher-Flag 110 auf "13" ge- 
setzt ist, was anzeigt, daB die rninimale GroBe des veran- 35 
derten Elements das Bit ist. Fur eine Bit-Ebenen-Verbin- 
dung sind die Bitmasken- Flags 126—137 der Teilwort- 
Speicher-Bhrnaske 124 in einer 1 : 1-Beziehung den Bits 
des Datenblocks 118 zugeordnet (Fig. 4 stellt den Fall 
dar, bei dem die Bitmasken-Flags 126—137 in einer 40 
1 : 1-Beziehung den Bytes 146— 157 des Datenblocks fiir 
eine Byte-Ebenen-Verbindung zugeordnet sind). Bevor- 
zugterweise ist jede der Bitmasken-Flags 126—137 ein 
Einzel- Bit- Wert, wobei eine Eins anzeigt, daB das zuge- 
x.ordnete Bit des Datenblocks 118 verandert wurde (wie 45 
bei einer vorhergehenden Verbindung) und eine Null 
keine Veranderung anzeigt. Durch Verwendung dieser 
Teilwort-Speicher-Bitmaske 124 werden die verander- 
ten Bits der Zwischengespeicherten Kopie 86 an Stellen. 
die den unveranderten Bits des Datenblocks 118 ent- 50 
sprechen, in dem Datenblock gespeichert, um die Bit- 
Ebenen-Verbindung zu bewirken. 

Bei der bevorzugten Bit-Ebenen-Verbindung erzeugt 
die globale Speichersteuerung 30 (Fig. 1) fiir den ur- 
spriinglichen Datenblock 118 (unter der Annahme, der 55 
Datenblock 1 18 ist in dem globalen Speicher 32 gespei- 
chert) eine vorubergehende Bitmaske (nicht gezeigt) 
mit einer Einzel-Bit-Flag fiir jedes Bit des Datenblocks 
118 aus einer bitweisen EXCLUSIVE-ODER- Verknup- 
fung der zwischengespeicherten Kopie 86 des Blocks 60 
118. Dies setzt jede vorubergehende Bitmasken-Flag 
auf Eins, die einem Bit-Datenblock 318, das sich von 
dem entsprechend angeordneten Bit in der zwischenge- 
speicherten Kopie 86 unterscheidet, zugeordnet ist. Als 
nachstes speichert die globale Speichersteuerung 30 fur 65 
jedes Bit des Datenblocks 118, das im vorhergehenden 
nicht verandert wurde, das entsprechend angeordnete 
Bit der zwischengespeicherten Kopie 86 anstelle dieses 
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Bits. Dies kann durch eine bitweise logische UND- und 
ODER-Operation durchgefuhrt werden, wie es durch 
die folgende Gleichung dargestellt ist: 

B - (BUND NICHT M) ODER (C UND M) (1). 

Wobei B den Datenblock 1 18 darstelit, M stellt die Teil- 
wort-Speicher-Bitmaske 124 dar, C stellt die zwischen- 
gespeicherte Kopie 86 dar, UND ist die logische UND- 
Operation, ODER ist die bitweise logische ODER-Ope- 
ration, und NICHT ist die logische Komplementar-Ope- 
ration. Die globale Speichersteuerung 30 fuhrt dann die 
bitweise logische ODER-Operation der Teilwort-Spei- 
cher-Bitmaske 124 mit der vorubergehenden Bitmaske 
durch, um die Teilwort-Speicher-Bitmaske zu aktualisie- 
ren. 

Nachdem die Halbwort-, Byte- und Bit-Ebenen-Ver- 
bindung gemaB den unveranderten Datenelementen des 
Datenblocks gesteuert sind, ist es notwendig, die Mog- 
lichkeit einzubeziehen, daB ein einzelner Prozessor ei- 
nen Datenblock mehr als einmal zwischen Synchronisa- 
tionen zwischenspeichert und verandert. Entweder 
kann das Aussetzungsschema des dritten Ausfuhrungs- 
beispiels oder das alternative Verbindungsschema des 
achten Ausfiihrungsbeispiels fiir diese Aufgabe verwen- 
det werden. 

Patentanspriiche 

1. Verfahren zur gemeinsamen Verwendung eines 
Speichers in einem Multiprozessor-Computersy- 
stem (20), mit folgenden Schritten: 
Speichern einer Mehrzahl von Datenblocken (118, 
196, 280) in einem globalen Speicher (32); 
fiir jeden anfragenden Prozessor (22—24), Spei- 
chern einer Kopie (54, 86 ( 224) eines urspriinglichen 
Datenblocks in einem Cache-Speicher (44— 46), der 
dem abfragenden Prozessor ortlich zugeordnet ist, 
zum Zugriff durch den abfragenden Prozessor; 
Nachverfolgen, welche Elemente (70 — 74. 80 — 82, 
230— 234) der Kopien durch ihren abfragenden 
Prozessor verandert werden; und 
Verbinden der Kopien durch Speichern dieser Ele- 
mente der Kopien, die verandert wurden, in dem 
Datenblock. 

2. Verfahren nach Anspruch 1, bei dem der Schritt 
des Nachverfolgens folgende Schritte aufweist: 
Speichern einer Bitmaske (56, 88, 220) in dem Ca- 
che-Speicher (40—46), die eine Flag (60— 64, 
90 — 92, 240— 244) umfaBt, die jedem Datenelement 
(70 - 74, 80 - 82, 230 - 234) der Kopie (54, 86, 224) 
zugeordnet ist, wobei jede Flag anfangiich auf ei- 
nen ersten Wert gesetzt ist; 

Setzen der Flag in der Bitmaske, die jedem der 
Datenelemente zugeordnet ist, die durch den abfra- 
genden Prozessor geschrieben sind, auf einen zwei- 
ten Wert; und 

wobei der Schritt des Verbindens der Kopie und 
des urspriinglichen Datenblocks das Speichern je- 
des Datenelements der Kopie dessen zugeordnete 
Flag auf den zweiten Wert gesetzt ist im urspriing- 
lichen Datenblock (118, 196,218) umfaBt. 

3. Verfahren zur gemeinsamen Verwendung eines 
Speichers (32, 33) bei mehreren Prozessoren 
(22—24), das folgende Schritte aufweist: 
Speichern gemeinsamer Daten in einem globalen 
Speicher (32, 33), wobei die gemeinsamen Daten 
eine Mehrzahl von Datenblocken (118, 196, 280) 
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umfassen; 

fur jeden Prozessor (22—24), der auf Daten in ei- 
nem der Datenblocke zugreift: 
Speichern einer lokalen Kopie (54, 86, 224) des Da- 
tenblocks in dem lokalen Speicher des Prozessors; 5 
Zuordnen einer Mehrzahl von Schreibe-Flags 
(60—64, 90—92, 240—244) einer lokalen Kopie in 
dem lokalen Speicher in einer 1 : 1-Beziehung zu 
einer Mehrzahl von Datenelementen (70—74, 
80—82, 230—234) mit einer ersten GroBe in der 10 
lokalen Kopie, wobei jede der Schreibe-Flags der 
lokalen Kopie anfanglich auf einen Nicht-geschrie- 
ben-Wert gesetzt ist; 

fur jedes der Datenelemente mit der ersten GroBe 
der lokalen Kopie, das durch den Prozessor veran- 15 
dert wird, Setzen seiner zugeordneten Schreibe- 
Flags der lokalen Kopie auf einen Geschrieben- 
Wert; 

Obermitteln der lokalen Kopie und der Schreibe- 
Flags der lokalen Kopie an den globalen Speicher, 20 
wenn die lokale Kopie aus dem lokalen Speicher 
geloscht wird; 

Verbinden der lokalen Kopie und des Datenblocks 
in dem globalen Speicher, fur jede der Schreibe- 
Flags der lokalen Kopie, die auf einen Geschrie- 25 
ben-Wert gesetzt sind, durch Speichern des Daten- 
elements der ersten GroBe, daB einer solchen 
Schreib-Flag der lokalen Kopie zugeordnet ist, in 
dem Datenblock; und 

wenn mehrere Prozessoren gleichzeitig auf den 30 
Datenblock zugreifen: 

Identifizieren des Auftretens einer Schreibe/ 
Schreibe-Datenwettlaufbedingung, bei der zumin- 
dest zwei Prozessoren Schreibe-Flags der lokalen 
Kopie, die beide auf den Geschrieben- Wert gesetzt 35 
sind und Datenelementen mit einer ersten GroBe 
zugeordnet sind, an entsprechendc Stellen ihrer je- 
weiligen lokalen Kopien senden. 
4. Verfahren nach Anspruch 3, bei dem der Schritt 
des Verbindens der lokalen Kopie (54, 86, 224) und 40 
des Datenblocks (118, 196, 288) in dem globalen 
Speicher (32, 33) folgende Schritte aufweist: 
Zuordnen einer Mehrzahl von Datenblock-Schrei- 
be-Flags (290—293) in dem globalen Speicher zu 
einer Mehrzahl von Datenelementen (296—299) 45 
mit einer ersten GroBe in dem Datenblock, wobei 
jede der Datenblock-Schreibe-Flags anfanglich auf 
einen Nicht-geschrieben-Wert gesetzt ist; 
Zuordnen einer speziellen Verbindungs-Flag (282) 
zu dem Datenblock in dem globalen Speicher, wo- 50 
bei die spezielle Verbindungs-Flag anfanglich auf 
einen ersten Wert gesetzt ist; 

fur jede gespeicherte lokale Kopie, wiihrend der 

Datenblock teilweise verbunden ist: 

Speichern einer Duplikatkopie (308) des teilweise 55 

verbundenen Datenblocks in einem Tabellenein- 

trag (309) fur die lokale Kopie; und 

Setzen der speziellen Verbindungsflag auf einen 

zweiten Wert; 

wenn die spezielle Verbindungsflag auf den ersten 60 
Wert gesetzt ist, Speichern solcher Datenelemente 
der lokalen Kopie, die sich von den entsprechend 
angeordneten Datenelementen der ersten GroBe 
des Datenblocks unterscheiden, deren zugeordnete 
Datenblock-Schreibe-Flag auf den Nicht-geschrie- 65 
ben-Wert in dem Datenblock gesetzt ist; 
wenn die spezielle Verbindungsflag auf den zwei- 
ten Wert gesetzt ist und die lokale Kopie gespei- 
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chert wurde, als der Datenblock nicht teilweise ver- 
bunden war, Speichern solcher Datenelemente der 
lokalen Kopie in dem Datenblock, die sich von den 
entsprechend angeordneten Datenelementen der 
ersten GroBe des Datenblocks unterscheiden, wah- 
rend zugeordnete Datenblock-Schreibe-Flag auf 
den Nicht-geschrieben-Wert gesetzt ist; und 
wenn die spezielle Verbindungsflag auf den zwei- 
ten Wert gesetzt ist und die lokale Kopie gespei- 
chert wurde, als der Datenblock teilweise verbun- 
den war, Speichern derjenigen Datenelemente der 
lokalen Kopie in den Datenblock, die sich von ent- 
sprechend angeordneten Elementen der Duplikat- 
kopie in dem Tabelleneintrag fur die lokale Kopie 
unterscheiden. 

5. Verfahren nach Anspruch 3, das ferner folgende 
Schritte aufweist: 

fur jeden Prozessor (22 — 24), der auf Daten in ei- 
nem der Datenblocke zugreift: 
Zuordnen einer Teilwort-Speicher-Flag (110) zu 
der lokalen Kopie (86) in dem lokalen Speicher 
(44 —46) des Prozessors, wobei die Teilwort-Spei- 
cher-Flag die minimale GroBe eines veranderten 
Datenelements anzeigt und anfanglich gesetzt ist, 
urn eine erste GroBe anzuzeigen, wobei die erste 
GroBe diejenige der Datenelemente mit der ersten 
GroBe (80— 82) ist; 

Setzen der Teilwort-Speicher-Flag, um eine zweite 
GroBe anzuzeigen, wenn der Prozessor eine Teil- 
wort-Speicher-Operation bezuglich der lokalen 
Kopie durchfuhrt; und 

Senden der Teilwort-Speicher-Flag zusammen mit 
der lokalen Kopie und den lokalen Kopie-Schreibe- 
Bit- an den globalen Speicher, wenn die lokale Ko- 
pie aus dem lokalen Speicher geloscht wird; 
wenn die Teilwort-Speicher-Flag eingestellt ist, um 
die zweite GroBe anzuzeigen; 
Zuordnen einer Mehrzahl von Datenblock-Schrei- 
be-Flags (126—137) in dem globalen Speicher (32, 
33) 1 : 1 zu einer Mehrzahl von Datenelementen 
(146— 157) der zweiten GroBe in dem Datenblock 
(118), wobei die zweiten Datenelemente die zweite 
GroBe haben, wobei die Datenblock-Schreibe- 
Flags anfanglich auf den Nicht-geschrieben-Wert 
gesetzt sind; und 

fur jedes Datenelement der zweiten GroBe des Da- 
tenblocks, dessen zugeordnete Flag auf den Nicht- 
geschrieben-Wert gesetzt ist, wenn sich ein Daten- 
element (96—107) an einer entsprechenden Stelle 
der lokalen Kopie und ein solches Datenelement 
mit zweiter GroBe unterscheiden, Speichern der 
lokalen Kopie des Datenelements anstelle eines 
solchen Datenelements mit zweiter GroBe und Set- 
zen der Datenblock-Schreibe-Flag auf dem Ge- 
schrieben- Wert, die dem Datenelement mit zweiter 
GroBe zugeordnet ist; und 

wenn die Teilwort-Speicher-Flag gesetzt ist, um die 
erste GroBe anzuzeigen: 

fur jede der Schreibe-Flags der lokalen Kopie, die 
auf den Geschrieben- Wert gesetzt sind, Speichern 
des Datenelements mit der ersten GrdBe, das einer 
solchen Schreibe-Flag der lokalen Kopie zugeord- 
net ist, in den Datenblock. 

6. Verfahren nach Anspruch 3, das ferner folgende- 
Schritte aufweist: 

fur jeden Prozessor (22—24), der auf Daten in ei- 
nem der Datenblocke (196) zugreift: 
Zuordnen einer Mehrzahl von Lese-Flags 
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(250— 253) in dem lokalen Speicher (224) in einer 
1 :1-Beziehung mit den Datenelementen mit der 
ersten GroBe (230—234) der lokalen Kopie (224), 
wobei die Lese-Flags anfanglich auf einen Nicht- 
gelesen-Werl gesetzt sind; 5 
wenn ein Datenelemem mit erster GroBe durch 
den Prozessor gelesen wird, Setzen seiner zugeord- 
neten Lese-FIag auf einen Gelesen-Wert; und 
Ubermitteln der Lese-FIag zusammen mit der loka- 
len Kopie und den Schreibe- Flags (240 — 244) der jo 
iokalen Kopie an den globalen Speicher (32, 33), 
wenn die lokale Kopie aus dem lokalen Speicher 
geldscht wird; und 

wenn mehrere Prozessoren (22—24) gleichzeitig 
auf den gleichen Datenblock (196) zugreifen: 1 5 

Identifizieren des Auftretens eines Lese-Schreibe- 
Datenwettlaufs, wobei ein Prozessor eine Schrei- 
be-Flag der lokalen Kopie, die auf den Geschrie- 
ben-Wert gesetzt ist, sendet, und ein weiterer Pro- 
zessor eine Lese-FIag, die auf den Gelesen- Wert 20 
gesetzt ist, sendet, und wobei die Schreibe- und 
Lese-Flags den Datenelementen mit der ersten 
GroBe an den entsprechenden Stellen ihren jeweili- 
gen lokalen Kopien zugeordnet sind. 

7. Verfahren nach Anspruch 3, das ferner folgende 25 
Schritte aufweist: 

Zuordnen einer Sperr-Flag (160) zu jedern Daten- 
block (1 18) in dem globalen Speicher (32, 33), wobei 
die Sperr-Flag anfanglich auf einen Ungesperrt- 
Wert gesetzt ist; 30 
Setzen der Sperr-Flag auf einen Gesperrt-Wert, 
wenn dies durch einen ersten der Prozessoren 
(22—24) angefordert wird; 

wahrend die Sperr-Flag auf den Gesperrt-Wert ge- 
setzt ist, Verbieten des Zugriffes auf den Daten- 35 
block durch irgendeinen der Prozessoren und An- 
ordnen einer Anfrage beziiglich eines Zugriffs auf 
den Datenblock oder einer Sperrung durch solche 
Prozessoren in einer Abfragewarteschlange (362) 
fur ausgesetzte Zugriffe; 40 
Rucksetzen der Sperr-Flag auf den Ungesperrt- 
Wert, wenn dies durch den ersten Prozessor abge- 
fragt wird; und 

wenn die Sperr-Flag auf den Ungesperrt-Wert zu- 
riickgesetzt ist, Verarbeiten der Anfragen in der 45 
Abfragewarteschlange fur ausgesetzte Zugriffe. 

8. Verfahren nach Anspruch 3, das ferner folgende 
Schritte aufweist: 

wenn es durch einen Prozessor (22—24) angefragt 
wird, Durchfuhren einer globalen Reduktions-Ope- 50 
ration beziiglich der Daten in dem globalen Spei- 
cher (32, 33), und Speichern eines Ergebnisses der 
globalen Reduktions-Operation an einer bestimm- 
ten Stelle des globalen Speichers. 

9. Verfahren nach Anspruch 3, das ferner folgende 55 
Schritte aufweist: 

Speichern einer Mehrzahl von globalen Kopien ei- 
nes Datenblocks (118, 196, 280), in jedem einer 
Mehrzahl von globalen Speichern (32,33); 
Zuordnen einer Mehrzahl von Prozessoren 60 
(22—24) jedem der Mehrzahl von globalen Spei- 
chern; 

wenn ein Prozessor (22— 24) Zugriff auf den Daten- 
block anfragt, Zugreifen durch einen solchen Pro- 
zessor auf die globale Kopie des Datenblocks in 65 
einem globalen Speicher, das einem solchen Pro- 
zessor zugeordnet ist; 

wobei der Schritt des Zugreifens auf die globaie 
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Kopie folgende Schritte aufweist; 
Speichern einer lokalen Kopie (54, 86, 224) der glo- 
balen Kopie in einem lokalen Speicher (44—46) des 
Zugreifenden Prozessors; und 

wenn die lokale Kopie aus dem lokalen Speicher 
geloscht wird, Verbinden der lokalen Kopie mit der 
globalen Kopie in dem globalen Speicher, der dem 
zugreifenden Prozessor zugeordnet ist; und 
nachdem alle lokalen Kopien einer der globalen 
Kopien mit einer solchen globalen Kopie verbun- 
den sind, Verbinden solcher globalen Kopien mit 
weiteren globalen Kopien. 

10. Multiprozessor-Computersystem (20) mit ge- 
meinsam benutztem Speicher, mit: 
einem oder mehreren globalen Speichereinheiten 
(26, 27), wobei jede globale Speichereinheit einen 
globalen Speicher zum Speichern einer Mehrzahl 
von Datenbiocken (118, 196, 280) der gemeinsam 
verwendeten Daten (32, 33) umfaBt, wobei jeder 
Datenblock eine Mehrzahl von Mchr-Bit-Datcn- 
elementen (120- 122, 190- 194, 296-299) umfaBt; 
einer Mehrzahl von Verarbeitungseinheiten 
(22—24), die mit dem einen oder mehreren globa- 
len Speichereinheiten verbunden sind, wobei jede 
der Verarbeitungseinheiten einen Prozessor 
(36—38) und einen lokalen Speicher (44—46) zum 
Speichern einer Schreibe-Bitmaske (56,88,220) und 
einer lokalen Kopie (54, 86, 224) des einen der Da- 
tenblocke umfaBt, wenn Zugriff auf die Daten in 
dem Datenblock durch den Prozessor angefordert 
wird, wobei die Schreibe-Bitmaske eine Mehrzahl 
von Flags (60 —64, 90— 92, 240— 244) umfaBt, die in 
einer 1 : 1-Beziehung den Datenelementen (70— 74, 
80 — 82, 230—234) der lokalen Kopie zugeordnet 
sind, wobei die Flags anfanglich auf einen Nicht-ge- 
schrieben-Wert gesetzt sind, wenn die lokale Kopie 
in dem lokalen Speicher gespeichert wird; 
wobei jede der Verarbeitungseinheiten ferner eine 
lokale Speichersteuerung (40—42) umfaBt, wobei 
jede lokale Speichersteuerung wirksam ist, urn die- 
jenigen Schreibe-Bitmasken- Flags auf einen Ge- 
schrieben-Wert zu setzen, die Datenelementen, die 
durch den Prozessor geschrieben wurden, zugeord- 
net sind, und um, wenn die lokale Kopie mit ande- 
ren Daten in dem lokalen Speicher ersetzt wird, die 
Schreibe-Bitmaske und die geschriebenen Daten- 
elemente an die globale Speichereinheit zu senden, 
wenn irgendwelche Datenelemente durch den Pro- 
zessor geschrieben wurden; 

einer globalen Speichersteuerung (30, 31) in der 
globalen Speichereinheit, die wirksam ist, um eine 
lokale Kopie, die von einer der Verarbeitungsein- 
heiten empfangen wurde durch Speichern jedes der 
Datenelemente im Datenblock, deren zugeordncte 
Schreibe-Bitmaske-Flag auf den Geschrieben- 
Wert gesetzt ist, zu verbinden. 
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